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内 容 提 要 


调试 对 于 软件 的 成 败 至 关 重 要 ， 正 确 使 用 恰当 的 调试 工具 可 以 提高 发 现 和 改正 错误 的 效率 。 本 书 详 
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HRS 4. GUI 和 并 行程 序 ， 以 及 如 何 躲 开 稼 匈 的 调试 陷阱 。 

本 书 适 合 各 层次 软件 开发 人 员 、 管 理 人 员 和 测试 人 员 阅 读 。 
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“WE, AA!” RIIE Andrew Er RUA EIER] VAN LH JG ee. Andrew = FHE 
大 一 上 编程 诬 时 就 学 过 了 调试 工 上 其 , 不 过 那 时 他 只 是 将 调试 工具 当做 应 付 期 末 考 试 的 内 容 来 打发 
的 。 现 在 他 已 经 大 四 了 了， 教授 强烈 要 求 他 停止 采用 输出 语句 进行 调试 的 方法 ， 改 为 使 用 正式 调试 
工具 。 让 Andrew 豆 出 望 外 的 是 ， 他 发 现 使 用 恰当 的 工具 可 以 大 大 缩短 调试 时 间 。 

如 今 ， 在 学 生 及 已 参加 工作 的 程序 员 中 ,还 有 不 少 “Andrew” 但 愿 本 书 能 帮助 “Andrew 们 ” 
发 现 调试 工具 的 好 人 处。 但 是 ， 我 们 更 希望 本 书 能 帮助 那些 已 经 使 用 了 调试 工具 ， 但 还 无 法 确定 在 
什么 情况 下 访 做 什么 事 的 程序 员 做 出 适当 的 判断 。 本 书 也 适用 于 打算 进一步 学 习 调试 工具 及 其 幕 
后 原理 的 人 。 

本 书 的 编辑 曾 说 过 ,很 多 调试 知识 以 前 都 只 是 在 财 子 里 口 口 相 传 , 没有 正式 编 车 成 书 。 本 书 
将 改变 这 一 状况 。 本 书 回答 了 下 列 问题 。 

a 如 何 调试 线程 代码 ? 

O 为 什么 有 时 候 断 点 最 终 出 现 的 位 置 与 原来 设置 的 位 置 略 有 俩 甜 ? 

口 GDB 的 until 命 令 为 什么 有 时 会 跳 到 意 想 不 到 的 地 方 ? 

a 如 何 巧 妙 使 用 DDD 和 Eclipse? 

O 在 当今 普遍 使 用 GUI 的 时 代 ， 像 GDB 这 样 的 基于 文本 的 应 用 程序 还 有 价值 吗 ? 

a 为 什么 当 错误 代码 超出 数组 边界 时 不 发 生 段 错误 ? 

a 为 什么 要 将 我 们 的 一 个 示例 数据 结构 命名 为 nsp? 《〈 不 好 和 意思， 这 只 是 与 我 们 的 出 版 商 No 

Starch Press 私 下 开 的 一 个 玩 突 。) 

本 书 既 没有 美 其 名 日 “用 户 手 册 ” 也 不 是 关于 调试 过 程 认 知 理论 的 抽象 论文 。 本 书 有 点 介 
于 这 两 者 之 间 。 一 方面 ， 人 确实 提供 了 如 何 操作 GDB、DDD 和 和 Eclipse 中 特定 命令 的 信息 ; 为 一 方 
面 ， 讲 解 并 频繁 使 用 了 关于 调试 过 程 的 一 些 通 用 原则 。 

我 们 之 所 以 选择 GDB、DDD 和 Eclipse， 古 因为 它们 在 Linux/ 开 源 社 区 中 比较 流行 。 本 书 的 示 
例 有 点 依 问 于 GDB， 不 仅仅 因为 GDB 基 于 文本 的 性 质 使 得 显示 在 一 个 页 面 中 更 紧凑 ， 而 且 正 如 
上 面 的 问题 所 上 暗示 的 ， 我 们 发 现 基于 文本 的 命令 在 调试 过 程 中 仍然 起 看 举足轻重 的 作用 。 

Eclipse 的 用 途 越 来 越 广泛 ， 其 远 不 止 仅 作 为 我 们 这 里 的 调试 角色 ， 还 提供 了 各 种 有 吸引 力 的 
调试 工具 。 男 一 方 和 面 ，DDD 占 用 空间 小 ， 而 且 包 括 了 Eclipse 中 不 具备 的 某 些 强大 功能 。 

第 1 章 是 概览 。 很 多 经 验 丰富 的 程序 员 可 能 想 跳 过 这 一 章 ， 但 是 我 们 强烈 建议 大 家 通读 一 通 ， 
因为 这 一 和 章 列 出 了 我 们 针对 调试 过 程 推荐 的 一 些 徐 单 却 有 用 的 通用 准则。 


































































































BRA ENA Y Mili d n] 2b EIS AN AE Wet, We SRR Aan, GARE, 
删除 和 共用 断 点 ， 从 一 个 断 点 移 a 到 男 一 个 断 点 ， 查 看 关于 靳 点 的 详细 信息 ， 等 等 。 

到 达 断 点 后 会 出 现 什么 情况 呢 ? 第 3 草 回 答 了 这 一 问题 。 我 们 这 里 采用 的 示例 涉及 过 历 树 的 
代 但 ， 重 点 是 介绍 当 到 达 断 点 时 如 何方 便 地 显示 树 中 节点 的 内 容 。 这 里 GDB 相 当 出 色 ， 提 供 了 一 
些 非 常 灵 活 的 功能 ， 有 助 于 在 每 次 程序 暂停 时 有 效 地 显示 感 兴趣 的 信息 。 这 一 章 还 提供 了 一 个 特 
别 优 秀 的 用 网 形 显 示 树 和 其 他 链接 数据 结构 的 DDD 功 能 。 

第 4 草包 括 了 由 于 段 错误 而 产生 的 致命 运行 时 错误 。 我 们 首先 介绍 了 央 溪 时 在 底层 发 生 了 什 
AH, 包括 程序 的 内 存 分 配 以 及 硬件 与 操作 系统 的 协同 作用 。 对 系统 知识 比较 了 解 的 谈 者 可 能 会 
跳 过 这 一 章 ， 但 是 我 们 相信 ， 其 他 很 多 恋 者 会 得 益 于 这 一 草 介 绍 的 基础 知识 。 然 后 介绍 了 核心 文 
件 ， 包 括 如 何 创建 核心 文件 ， 如 何 使 用 它们 来 完成 “事后 反思 ”。 最 后 介绍 了 关于 调试 会 话 的 一 
个 扩展 示例 ， 其 中 有 几 个 程序 错误 产生 了 段 错误 。 

第 $ 草 不 但 介绍 并 行 编程 ， 而 且 包 括 网 络 代 码 。 客 户 / 服 务 喜 网 络 编程 可 算 作 并 行 处 理 ， 甚 至 
我 们 的 工具 也 是 并 行使 用 的 。 比 如 ， 在 两 个 窗口 中 使 用 GDB， 一 个 窗口 用 于 客户 机 ， 另 一 个 窗口 
用 于 服务 右 。 由 于 网 络 代 人 码 涉及 系统 调用 ， 因 此 我 们 用 C/C++ 的 errno 变 量 和 Linux 的 strace 命 令 
补充 我 们 的 调试 工具 。5.2 市 涉及 线程 编程 。 这 里 同样 肯 先 概述 基本 内 容 : 分 时 、 进 程 与 线程 、 
苑 争 条 件 等 。 这 一 半 介 绍 了 在 GDB、DDD 和 Eclipse 中 使 用 线程 的 拉 术 细节 ， 并 再 次 讨论 了 一 些 
要 记 住 的 通用 原则 ， 比 如 友 生 线程 上 下 文 切换 时 的 时 间 选 择 随机 性 。5.4 节 介绍 了 用 流行 的 MPI 
和 OpenMP 程 序 包 进行 并 行 编程 ， 并 举 了 一 个 OpenMP 的 扩展 示例 。 

第 6 草包 括 其 他 一 些 重 要 主题 。 如 末代 但 不 能 编译 ， 那 么 调试 工具 将 无 能 为 力 ， 因 此 这 一 章 
讨论 了 处 理 这 种 问题 的 一 些 方法 。 然 后 处 理由 于 缺少 必要 的 库 造 成 的 连接 失败 问题 ， 我 们 再 一 次 
觉得 提供 一 些 “ 理 论 ” 是 有 用 的 ， 比 如 库 的 芙 型 以 及 如 何 将 库 与 主要 代 介 连接。 如 何 调试 GUI 程 
FWE? 为 了 简便 起 见 ， 我 们 这 里 坚持 采用 “ 半 GUI” 设 置 一 一 curses 编 程 ， 并 显示 如 何 让 GDB、 
DDD 和 Eclipse 与 curses 窗 口中 的 事件 交互 。 

正如 前 面 提 到 的 ， 可 以 使 用 辅助 工具 使 调试 过 程 得 到 很 大 的 增强 ， 第 7 章 介 绍 了 部 分 辅助 工 
具 ， 还 介绍 了 errno 和 strace、1int 的 一 些 内 容 ， 以 及 对 于 有 效 使 用 文本 编辑 右 的 一 些 提示 。 

全 书 主要 介绍 的 是 C/C++ 编程 的 调试 ， 第 8 章 则 谈 到 了 其 他 语言 ， 包 括 Java、Python、Perl 和 
汇编 语言 。 

如 果 汤 挥 了 读者 喜欢 的 调试 主题 ,我 们 感到 抱 蒜 ， 书 中 包括 了 我 们 目 己 编程 时 发 现 有 用 的 全 
部 内 容 。 

感谢 No Starch Press 的 诸位 工作 人 员 在 这 个 项 目 上 花 了 很 长 时 间 来 协助 我 们 。 尤 其 感谢 公司 
的 创始 人 及 总 编辑 Bil Pollock。 他 一 开始 束 对 我 们 这 个 “非常 规 ” 项 目 抱 有 信心 ， 并 和 客 容 了 我 们 
的 多 次 延误 。 

Daniel Jacobowitz 对 本 书 的 初稿 做 了 认真 的 审 耕 ， 并 提出 了 许多 宝 贯 建议 。 还 有 Neil Ching, 
虽然 他 表面 上 是 做 文字 编辑 的 ， 实 际 上 却 是 拥有 计算 机 和 区 十 学 位 的 高 材 生 。 他 在 我 们 的 技术 讨论 
中 提出 了 一 些 重要 看 法 。 本 书 质量 的 提高 很 大 程度 上 得 益 于 从 Daniel 和 Neil 处 得 到 的 反馈 。 当 然 ， 
照例 要 做 一 下 免责 声明 : 如 果 还 有 错误 ， 那 一 定 是 我 们 目 己 造成 的 。 












































































































































NormB*58]. IER dE I] F Gamis & JLLaura, ix PYF) eA T bu aE Be Seo JS 
管 这 本 书 她 们 一 个 学 也 没 看 过 ,， 但 是 她 们 解决 问题 的 方法 、 幽 默 的 性 格 和 对 生活 的 热爱 深 深 地 影 
响 了 我 。 还 要 感谢 这 么 多 年 来 我 教 过 的 学 生 ， 他 们 教会 我 的 与 我 教会 他 们 的 一 样 多 ， 是 他 们 让 我 
觉得 我 选 对 了 职业 。 我 一 直 致 力 于 “有 所 作为 ”， 但 愿 这 本 书 能 算 作 我 的 一 个 小 小 作为 。 

Pete 的 致谢 。 我 还 要 感谢 Nicole Carlson, Mark Kim 和 Rhonda Salzma， 人 花 了 不 少时 间 来 通读 
本 书 的 各 革 ， 提 出 了 更 正 与 建议 ， 感 谢 你 们 阅读 本 书 。 还 要 感谢 Davis 的 Linux 用 户 组 上 这 么 多 年 
来 回答 我 问题 的 人 们 ， 认 识 你 们 使 我 更 聪明 。 感 谢 Evelyn 提 升 了 我 生活 的 方方面面 。 特 别 值得 一 
提 的 是 小 猫 号 Geordi， 它 总 是 趴 在 我 的 稿 纸 上 ， 以 免 稳 子 锐 吹 敬 ， 还 时 党 为 我 温暖 座 椅 ， 并 值守 
书房 。 我 每 天 都 在 想念 你 们 。 小 家 伙 ， 睡 吧 。 妈 妈 1， 看 儿子 棒 吗 ? 
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4e. 特 列 是 专业 人 士 ， 可 能 想到 跳 过 本 童 内 容 。 然 而 ， 我 们 建议 每 个 人 都 应 该 全 
少 简 单 浏 览 一 下 。 许 多 专业 人 士 会 从 中 发 现 一 些 对 于 他 们 来 说 是 全 新 的 内 容 。 无 论 如 
何 ， 所 有 读者 邦 应 该 熟悉 这 些 内 容 ， 这 一 所 很 重要 ， 因 为 其 后 的 各 革 部 将 用 到 这 些 内 容 。 当 然 ， 
饱学 者 更 应 该 仔细 地 阅读 本 章 。 

本 革 前 儿 廊 将 概述 调试 过 程 并 介绍 调试 工具 的 作用 ， 然 后 在 1.7 市 给 出 一 个 扩展 性 示例 。 


1.1 本 书 使 用 的 调试 工具 


本 书 中 ， 我 们 将 曾 明 调试 的 基本 原则 ， 并 且 在 如 下 调试 工具 的 环境 中 说 明 这 些 基 本 原则 。 

e GDB 

Unix 程 序 员 最 常用 的 调试 工具 是 GDB， 这 是 由 Richard Stallman〈 开 源 软 件 运动 的 领路 人 ) JT 
发 的 GNU 项 目 调试 器 (GNU Project Debugger)， 该 工具 在 Linux 开 发 中 扮演 了 关键 的 角色 。 

大 多 数 Linux 系 统 应 该 预先 安装 了 GDB。 如 果 没 有 预先 安装 该 工具 ， 则 必须 下 载 GCC 编 译 右 
程序 包 。 

e DDD 

BEXRGUI CEDERIP ZB RRR, Ae feUnix fe PIS AT INE T GUI VS A ak CIT c 
出 来 。 其 中 的 大 多 数 工具 都 是 GDB 的 GUI 前 端 : 用 户 通过 GUI 发 出 命令 ，GUI 将 这 些 命 令 传递 给 
GDB. DDD (Data Display Debugger, AE EKAR We PAST 

如 果 你 的 系统 还 没有 安装 DDD， 则 可 以 下 载 该 工具 。 例 如 ， 在 Fedora Linux 系 统 上 ， 命 令 


yum install ddd 












































将 目 动 处 理 整 个 安装 过 程 。 在 Ubuntu Linux 上， 可 以 使 用 命令 apt-get。 

e Eclipse 

有 些 读者 可 能 使 用 过 IDE 集成 开发 环境 )。IDE 也 是 一 种 调试 工具 ， 它 在 一 个 程序 包 中 集成 
了 编辑 器 、 生 成 工具 、 调 试 器 和 其 他 开发 辅助 程序 。 本 书 中 的 示例 IDE 是 非常 流行 的 Eclipse 系统 。 
与 DDD 一 样 ，Eclipse 在 GDB 或 其 他 一 些 调试 右 的 基础 上 运行 。 

可 以 通过 如 上 所 述 的 yum 或 apt-get 命 令 安 装 Eclipse， 也 可 以 直接 下 载 相 应 的 .zip 文 件 ， 在 适 
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当 的 目录 (例如 /ser/ocal) 中 解压 缩 访 文件。 
本 书 使 用 3.3 版 本 的 Eclipse 系统 。 


1.2 ”编程 语言 
本 书 主要 面向 C/C++ 编程 ， 并 且 将 在 该 环境 中 完成 大 多 数 示例 。 不 过 ， 第 8 章 也 会 讨论 其 他 


—s 


ine 


1.3. ”调试 的 原则 


虽然 调试 是 一 门 乞 术 而 非 科 学 ， 但 是 仍然 有 一 些 明 确 的 原则 来 指导 调试 的 实践 。 本 贡 将 讨论 
其 中 一 些 原则 。 

至 少 其 中 的 一 个 规则 ， 即 确认 的 基本 原则 (Fundamental Principle of Confirmation) 实际 上 是 
相当 有 效 的 原则 。 


1.3.1 调试 的 本 质 : 确认 原则 

下 面 的 规则 说 明了 调试 的 本 质 。 

@ 确认 的 基本 原则 

修正 充满 错误 的 程序 ， 就 是 逐个 去 确认 你 认为 正确 的 代码 确实 是 正确 的 。 当 你 发 现 其 中 某 个 
假设 不 成 立时 ， 就 表示 已 经 找到 了 关于 程序 错误 所 在 位 置 的 线索 ( 其 至 是 错误 本 身 ). 

换 一 种 表达 方式 来 说 : TOR! 

当 你 认为 关于 程序 的 某 件 事 情 是 正确 的 ,但 却 不 能 确认 它 ， 你 束 会 感到 惊讶 。 但 这 种 惊讶 是 
好 事 ， 因 为 这 种 发 现 会 引导 你 找到 程序 错误 所 在 的 位 置 。 


1.3.2 ”调试 工具 对 于 确认 原则 的 价值 所 在 


传统 的 调试 技术 只 是 回程 序 中 添加 跟踪 代码 以 在 程序 执行 时 输出 变量 的 值 ， 例 如 使 用 
printf() 或 cout 语 句 输 出 变量 的 值 。 你 可 能 会 问 :“ 这 样 操作 还 不 够 吗 ? 为 什么 要 使 用 GDB、DDD 
或 Eclipse 这 样 的 调试 工具 ? ” 

首先 ， 这 种 方法 要 求 有 策略 地 持续 添加 跟踪 代码 ， 重 新 编译 程序 ， 运 行程 序 并 分 析 跟 踪 代 码 
的 输出 ,在 修正 程序 错误 之 后 删除 跟 踊 代码， 并 且 针 对 发 现 的 每 个 新 的 程序 错误 重复 上 述 这 些 步 
又 。 这 种 工作 过 程 非常 耗 时 ， 并 且 容 易 令 人 疫 萎 。 了 最 为 重要 的 是 ， 这 些 操作 将 你 的 注意 力 从 实际 
任务 转移 开 ， 使 你 无 法 集中 精力 通过 严密 推理 去 得 找 程序 错误 。 

相反 , 通过 使 用 DDD 和 Eclipse 这 样 的 网 形 化 调试 工具 ， 只 需要 将 鼠标 指针 移动 到 代 但 显示 中 
的 变量 实例 上 方 束 可 以 检查 该 变量 的 值 ， 并 有 旦 此 时 会 显示 该 变量 的 当前 值 。 为 什么 还 要 在 整 夜 的 
调试 中 使 用 printf() 语 句 来 输出 变量 的 值 ， 肥 无 必要 地 让 日 己 更 加 疲 筋 ,等待 更 长 的 时 间 呢 ?不 
如 放松 心情 ， 使 用 调试 工 其 可 以 减少 所 花费 的 时 间 ， 减 轻 你 需要 处 受 的 厌烦 感 。 

使 用 调试 工具 不 仅仅 能 够 得 看 变量 。 在 许多 情况 下 ， 调 试 器 会 指出 程序 错误 所 在 的 大 概 位 置 。 
例如 ， 程 序 由 于 段 错误 〈 即 内 存 访问 错误 ) 而 月 法 。 在 本 章 后 面 的 样本 调试 会 话 中 可 以 看 到 ， 
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GDB/DDD/Eclipse 可 以 立刻 指出 段 错 误 所 在 的 位 置 , 这 一 般 就 是 (或 接近 于 ) 程序 错误 所 在 的 位 置 。 

类 似 地 ， 调 试 器 要 求 用 户 设置 监视 点 〈watchpoint)， 通 过 监视 点 可 以 了 解 在 程序 运行 期 间 某 
个 变量 的 值 到 达 可 疑 值 范围 的 具体 位 置 ， 而 不 用 调试 器 ， 只 查看 调用 printf() 获 得 的 输出 很 难 推 
断 出 这 种 信息 。 
1.3.3 ”其 他 调试 原则 

e 从 简单 工作 开始 调试 

在 调试 过 程 的 开始 阶段 ， 应 该 从 容易 、 简 单 的 情况 开始 运行 程序 。 这 样 做 也 许 无 法 揭示 所 有 
的 程序 错误 ,但 是 很 有 可 能 发 现 其 中 的 部 分 错误 。 例如， 如 果 代 码 由 大 型 循环 组 成 ， 则 最 容易 发 
现 的 程序 错误 是 在 第 一 次 或 第 二 次 迭代 期 间 引 发 的 程序 错误 。 

e 使 用 自 顶 向 下 的 方法 

你 可 能 已 经 了 解 如 何 使 用 自 顶 向 下 或 模块 化 的 方法 来 编写 代码 : 主 程序 不 应 该 过 长 ， 它 应 该 
去 调用 那些 执行 大 量 实际 工作 的 函数 。 如 果 某 个 执行 实际 工作 的 函数 较 长 ， 则 应 该 考虑 将 该 函数 
依次 分 解 为 多 个 较 小 的 模块 。 

除了 应 该 以 目 项 同 下 的 方式 编写 代码 之 外 ， 也 应 该 以 这 种 方式 调试 代码 。 

例如 ,假设 程序 使 用 函数 f()。 在 使 用 调试 工具 深入 代码 并 且 壳 到 对 f() 的 调用 时 ， 调 试 器 可 
让 你 选择 执行 过 程 中 下 一 次 暂停 的 位 置 一 一 是 在 调用 函数 的 第 一 行 还 是 在 函数 调用 后 的 下 一 条 
语句 。 在 许多 情况 下 ， 先 选 后 一 种 比较 好 : 执行 调用 ， 然 后 检查 与 调用 有 关 的 变量 的 值 ， 从 而 了 
解 该 函数 是 否 正 确 运 行 。 如 果 该 函数 正确 运行 ， 就 可 以 避免 单 步调 试 函 数 中 代码 这 样 既 浪费 时 间 
又 不 必要 的 工作 ， 因 为 这 些 代 人 码 并 没有 出 错 。 

@ 使 用 调试 工具 确定 段 错 误 的 位 置 

当 发 生 段 错误 时 ， 执 行 的 第 一 步 操作 应 该 是 在 调试 器 中 运行 程序 并 重新 产生 段 错误 。 调 试 器 
将 指出 发 生 这 种 错误 的 代码 行 。 然 后 ， 可 以 通过 调用 调试 器 的 反 向 跟踪 (backtrace) 功能 获得 其 
他 有 用 信息 ， 该 功能 会 显示 出 错 前 所 有 函数 的 调用 序列 。 

在 某 些 情况 下 ， 可 能 很 难 重 新 产生 段 销 误 ， 但 是 如 果 有 核心 文件 〈core file)， 则 仍然 可 以 执 
行 反 向 跟踪 以 确定 产生 段 错误 的 情况 ， 第 4 章 将 讨论 这 个 问题 。 

e 通过 发 出 中 断 确定 无 限 循环 的 位 置 

如 果 怀 疑 程 序 中 存在 无 限 循环 , 则 进入 调试 器 并 再 次 运行 程序 , 让 该 程序 执行 足够 长 的 时 间 以 
进入 循环 。 然后， 使 用 调试 器 的 中 断 命 令 挂 起 该 程序 ， 并 是 执行 反 向 跟踪 ， 了解 已 到 达 循 环 主体 的 
哪个 位 置 以 及 程序 是 如 何 到 达 该 位 置 的 。( 该 程序 还 没有 被 取消 执行 ， 可 以 根据 需要 恢复 执行 。) 

e 使 用 二 分 搜索 

你 可 能 已 经 在 有 序列 表 的 环境 中 看 到 过 二 分 搜索 。 例 如 ， 假 设 你 有 一 个 数组 x[] 包 含 按 升 序 
排列 的 500 个 数字 ， 并 且 希 望 确定 在 应 何 处 插入 新 的 数字 y。 首 先 将 y 与 元 素 x[258] 进 行 比较 ， 如 
果 结 果 是 y 小 于 该 元 素 ， 接 下 来 就 将 y 与 元 素 x[125] 进 行 比较 ;但 是 如 果 y 大 于 x[256]， 则 下 一 次 
就 将 y 与 x[375] 进 行 比较 。 在 后 一 种 情况 中 , 如 果 y 小 于 x[375], 则 将 其 与 x[312] 进 行 比较 , x[312] 
是 x[258] 和 x[375] 之 间 的 中 间 元 素 ， 以 此 类 推 。 在 每 次 迭代 过 程 中 保持 将 搜索 范围 减 半 ， 从 而 快 
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速 查 找到 插入 点 。 

在 调试 过 程 中 也 可 以 应 用 二 分 搜索 的 原理 。 假 设 你 知道 在 最 初 的 1 000 ARMAR, 4$ 
储 在 某 个 变量 中 的 值 在 某 个 时 刻 出 现 问 题 ,那么 一 种 方法 是 使 用 监视 点 跟踪 该 值 第 一 次 出 现 问 题 
时 所 在 的 迭代 过 程 ，1.5.3 节 将 讨论 这 种 高 级 技术 。 男 一 种 方法 则 是 使 用 二 分 搜索 ， 此 时 在 时 间 而 
不 是 空间 上 进行 二 分 。 首 先 检查 该 变量 在 第 500 次 迭代 后 的 值 ， 如 果 此 时 其 值 仍然 良好 ， 则 下 一 
次 检查 位 于 第 750 次 迭代 后 的 值 ， 以 此 类 推 。 

再 从 发 一 个 例子 ,假设 程序 中 的 茶 个 源 文件 根本 无 法 编译 ,由 语法 错误 产生 的 编译 器 消 居中 ， 
提 及 的 代码 行 有 时 与 实际 的 错误 位 置 相 去 其 还 ， 因 此 可 能 很 难 确定 该 位 置 。 在 这 种 情况 下 ， 二 分 
搜索 就 可 以 派 上 用 场 : NER CRER SPE OP APTS, Seer gin PER aR TSE 
误 消 居 是 否 仍然 存在 。 如 果 错 误 消 恩 仍 然 存 在 ， 则 错误 束 在 这 一 半 代 人 码 中 ; 如 果 错 误 消 息 不 再 出 
现 ， 则 错误 就 位 于 删除 的 那 一 半 代 码 中 。 一旦 确定 了 包含 程序 错误 的 一 半 代 码 ， 束 可 以 进一步 将 
程序 错误 限制 在 这 半 部 分 代码 的 一 半 ， 继 续 执行 相同 的 操作 直到 确定 问题 所 在 位 置 。 当 然 ， 在 开 
台 该 过 程 之 前 应 该 建立 原始 代码 的 副本 ， 或 者 更 好 的 方法 是 使 用 文本 编辑 需 的 撤销 功能 。 参 见 第 
7 瘟 ， 了 解 在 编程 时 适当 地 使 用 编辑 器 的 技巧 。 
1.4 ”对比 基 于 文本 的 调试 工具 与 基于 GUI 的 调试 工具 ， 两 者 之 间 的 折 

中 方案 

本 书 讨论 的 GUI (CDDD 和 Eclipse) 充当 用 于 C 和 C++ 的 GDB 以 及 其 他 调试 器 的 前 端 。 虽 然 GUI 
具有 显眼 的 外 观 并 且 使 用 起 来 也 比 基 于 文本 的 GDB 更 为 方便 , 但 是 本 书 主张 的 观点 是 基于 文本 的 
调试 器 和 基于 GUI 的 调试 右 〈 包 括 IDE) 在 不 同 环境 下 各 有 上 所 长 。 
1.4.1 简要 比较 界面 

为 了 快速 了 解 基于 文本 的 调试 工具 和 基于 GUI 的 调试 工具 之 间 的 区 别 ， 来 看 看 将 它们 用 于 本 
草 示 例 的 情况 。 该 示例 中 的 程序 是 jsert sort， 通 过 源 文件 ins.c 编 译 该 程序 ， 其 完成 的 是 插入 排 
序 。 

1. GDB: 纯 文 本 

为 了 使 用 GDB 局 动 针 对 这 个 程序 的 调试 会 话 ， 可 以 在 Unix 命 令 行 中 输入 如 下 命令 : 


$ gdb insert sort 































































































在 此 之 后 ，GDB 会 通过 显示 如 下 提示 符 来 邀请 你 提交 命令 : 
(gdb) 
2. DDD: GUI 调试 工具 
使 用 DDD 时 ， 通 过 在 Unix 命 令 行 中 输入 如 下 命令 来 开始 调试 会 话 ; 
$ ddd insert sort 


此 时 将 打开 DDD 窗 口 ， 在 此 之 后 殉 可 以 通过 GUI 提交 命令 。 
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DDD 和 窗口 的 一 般 外 观 如 图 1-1 所 示 。 可 以 看 到 ，DDD 窗 口 在 各 个 子 窗口 中 安排 信息 。 

O 源 文本 窗口 显示 源 代 人 码 。DDD 从 main() 也 数 处 开始 显示 ， 但 是 可 以 通过 使 用 窗口 右 侧 的 
滚动 条 移动 到 源 文 件 的 其 他 部 分 。 

O 菜单 栏 提供 各 种 菜单 类 别 ， 包 括 File (文件 )、Edit (编辑 ) 和 View (视图 )。 

a 命令 工具 列 出 最 常见 的 DDD 命 令 (例如 Run、Interrupt、Step 和 Next)， 从 而 可 以 快速 访问 


a 控制 全: 回顾 一 下 DDD 只 是 GDB 〈 和 其 他 调试 豆 ) 的 GUI 前 咒 。DDD 将 忌 标 选中 的 命 
令 转换 为 对 应 的 GDB 命 令 。 这 些 命令 和 它们 的 输出 显示 在 控制 台 窗 口中 。 此 外 ， 可 以 下 
接 通 过 控制 侣 窗口 提交 命令 给 GDB， 这 是 非 第 方便 的 功能 ， 因 为 并 不 是 所 有 的 GDB 命 令 
邦 有 对 应 的 DDD 命 令 。 

O 数据 帘 口 显示 已 经 请 求 连 续 吕 示 的 变量 的 值 。 在 执行 这 样 的 请 求 之 前 ， 这 个 子 千 口 不 会 
出 现 ， 因 此 它 没 有 出 现在 图 1-1 中 。 









































‘AO DDD: /home/p/code/InsLotsOfErrors.c 一 口 X 





File Edit View Program Commands Status Source Data 


p - = * ot = RLS SS " DEORE due 
(9 InskotsofErrors.c:1& (s E] e Uatch Ji Ls We 会 "es Z ondiep X HRS 


E 





2 // insertion sort, several errors 
// 


4 // usage: insert sort numi num2 num3 ..., where the numi are the numbers to 
5 //| be sorted 
6 
7- int x[10],  // input array 
8 vy[10], // workspace array 
9 num inputs,  // length of input array 
10 num y = 0; // current number of elements in y a 
11 BO DDD x 
12 void get argsí(int ac, char **av) Run 
d= T —nE 4; 
14 Interrupt | 
15 num inputs - ac - 1; Ste Ste 
Q6 for (i = 0; i < num inputs; i++) . Step | Step | 
17 x[i] = atoi(av[it1]); Next | Nexti | 
18 } Ary AX 
19 . Unt | Finish | MLA 
20 void scoot over(int jj) Cont Kill 
p _ cot | ow | 


21. { in 

= Up | Down | 
23 for (k = num y-1; k > jj; k++) Undo | Redo 
24 y[k] = y[k-1]; 

25 } 

26 


27 void insert(int new y) 


29 { int j; Y » BS 
29 源 文 本 窗口 
30 if (num y = 0) { // y empty so far, easy case 

31 y[0] = new vy; 

32 return; 

33 } 


Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread_db library "/lib/libthread_db.so.1". 





(gdb) break InsLotsOfErrors.c: 73 Hel] 公 
Breakpoint 1 at 0x80483b6: file InsLotsOfErrors.c, line 16. 控制 H 
(gdb) - 
A Set and edit breakpoints in source files J 


图 1-1 DDD 布 局 


下 面 简单 演示 在 每 种 类 型 的 用 户 界 面 下 如 何 将 调试 命令 提交 给 调试 器 。 在 调试 insert sort 程 
序 时 ， 你 可 能 希望 暂停 该 程序 的 执行 ， 从 而 在 函数 get_args() 的 第 16 行 (假设 ) 处 设置 断 点 (在 
1.7 市 中 将 看 到 insert_sort 的 完整 源 代 人 码 )。 为 了 在 GDB 中 设置 断 点 ， 可 以 在 GDB 提 示人 符 中 输入 如 
下 命令 


(gdb) break 16 


完整 的 命令 名 是 break， 但 是 GDB 人 允许 在 不 产生 歧义 的 情况 下 使 用 缩写 ， 并 且 大 多 数 GDB 用 
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户 会 在 此 处 输入 b 16。 考 虑 到 GDB 的 初学 者 不 易 理 解 这 些 缩写 ， 我 们 将 先 使 用 完整 的 命令 名 ， 在 
本 书 的 后 面 ， 当 用 户 已 经 较为 熟悉 这 些 命令 时 我 们 再 使 用 缩写 。 

使 用 DDD, 将 查看 源 文本 窗口 , 单 击 第 16 行 的 开始 位 置 , 然后 单 击 DDD 屏 幕 顶端 的 Break (中 
Wr) 图 标 。 也 可 以 在 第 16 行 的 开始 位 置 右 击 ， 然 后 选择 Set Breakpoint( 设 置 断 点 )。 男 一 种 方法 
是 在 代码 行 开 始 位 置 左 侧 的 任意 位 置 双击 该 代码 行 。 无 论 采 用 何 种 方法 , DDD 都 会 通过 在 该 行 中 
显示 小 的 停止 符号 来 确认 选择 ， 如 图 1-2 所 示 。 通 过 这 种 方式 ， 可 以 快速 浏览 断 点 。 


中 OO 


































DDD: /home/p/code/InsLotsOfErrors.c 





- sa A a Wa € z MO ty 
InsLotsÜfErrors.c:18 9 dd O å F A dM UA C £2 X 
Fidia WSC ENT ERAZ 5how Rotate: set  Undisp. 
2 // insertion sort, several errors 
3 ff 


4 // usage: insert sort numi num2 num3 ..., where the numi are the numbers to 
5 // be sorted 

6 

7 int x[10], // input array 

y[10], // workspace array 

num inputs,  // length of input array 


w co 















T num_y 0; // current number of elements in y EO DDD X 
12 void get args(int ac, char **av) 
JS t ane d* 
14 
15 num inputs = ac - 1; 
Q6 for (i = 0; i < num inputs; itt) 
zn x[i] = atoi(av[iti]); 
18 } 
T9 
20 void scoot over(int jj) 
21 { ant E; 
22 
23 for (k = num y-1; k > jj; k++) 
24 ylk] = y[k-1]; 
25.) 
26 
27 void insert (int new y) 
eo 1 dnt j: 
29 


if (num y = 0) { // y empty so far, easy case 
y[0] = new y; 









Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread db library "/lib/libthread db.so.1". 
(gdb) break InsLotsOfErrors.c:16 

Breakpoint 1 at 0x80483b6: file InsLotsOfErrors.c, line 16. 
(gdb) 





图 1-2 ”上 断 点 设置 


3. Eclipse: 不 只 是 GUI 调 试 器 

图 1-3 显 示 了 Eclipse 中 的 和 常规 环境 ， 按 照 Eclipse 术 语 ， 我 们 当前 正 处 于 调试 透视 图 (Debug 
Perspective) 中 。Eclipse 是 开发 许多 不 同类 型 软件 的 常规 框架 。 每 种 编程 语言 在 Eclipse 中 都 有 上 自 
己 的 插件 GUI， 即 透视 图 。 实 际 上 ， 对 于 同一 种 语言 可 能 有 多 个 竞争 的 透视 图 。 在 本 书 的 Eclipse 
操作 中 ， 我 们 将 使 用 用 于 CC++ 开 发 的 CC++ 透 视图 、 用 于 编写 Python 程序 的 Pydev 透 视图 等 。 也 
有 用 于 执行 实际 调试 工作 的 调试 透视 图 〈 这 有 一 些 语言 特 有 的 功能 )， 图 1-3 台 显示 了 该 透视 图 。 

C/C++ 透 视图 是 CDT 插 件 的 一 部 分 。 闫 似 于 DDD 的 情况 ，CDT 在 后 台 调 用 GDB。 

透视 独 的 相关 组 件 大 体 上 类 似 于 上 面 所 描述 的 DDD 的 窗口 组 件 。 透 视图 被 分 解 为 多 个 称 为 视 
图 的 选项 卡 趟 窗口 。 位 于 透视 图 堪 侧 的 是 源 文 件 加 gc 的 视图 , 也 有 用 于 检查 变量 值 的 变量 视图 (这 
时 该 视图 中 还 没有 任何 变量 值 ), 此 外 还 有 控制 台 视 图 ， 其 功能 非常 类 似 于 DDD 中 的 同名 子 窗口 ， 
另外 还 有 其 他 的 视图 。 

可 以 按照 与 在 DDD 中 相同 的 操作 来 可 视 化 地 设置 断 点 。 例 如 ， 在 图 1-4 中 ， 源 文件 窗口 中 的 
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代码 行 
for (i = 0; i « num inputs; i++) 


在 其 左 侧 页 边 空 日 处 有 一 个 监 色 符号 ， 表 示 此 处 有 一 个 断 点 。 


v DR - insert_sort/ins.c - Eclipse Platform 


Eile Edit Refactor Navigate Search Project Run Window Help 
| ci Gl &| @ | Or Or |e | Bi Ge © Or Oe 











j} Atisercion surt, severdi errurs 


// 

// usage: insert sort numl num2 num3 ..., 
// be sorted 

y : int[] 
int x[10], // input array n F 
y[10], // workspace array cea 
num inputs, // length of input array num_y : int 

nun y = 0; // current number of elements in y get. args(int, char") : void 


void get_args(int ac, char **av) scoot_over(int) : void 
insert(int) : void 
process data() : void 


o B| e B-ri “Oo 











Eile Edit Refactor Navigate Search Project Run Window Help 
| 名 |B |*- O- a- | # |t g e o 





> B oc 
Y [£]insert sort [C/C++ Local Application] 
"v GÈ gdb/mi (12/11/07 9:29 PM) (Suspended) 
"v gf? Thread [0] (Suspended: Breakpoint hit.) 
= 2 get. args() /workspace/insert_sort/ins.c:15 0x080483 
= 1 main0 /workspace/insert_sort/ins.c:63 0x08048542 





num inputs = ac - 1; x : int[] 
for (i = 0; i « num inputs; i++) = 
x[i] = atoi(av[i«1]); y : int] 
) num. inputs : int 
void scoot over(int jj) num. y : int 
( intk; get args(int, char**) : void 


for (k = num y-1; k > jj; k++) Scoot_over(int) : void 
ylk] = y[k-1]; insert(int) : void 
|» | D 9 process data() : void 
HS A Tasks] E Problems| — — č mw * * EE) uu c-7o 


insert sort [C/C++ Local Application] gdb (12/11/07 9:29 PM) 





1-4 在 Eclipse 中 删除 断 点 
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4. Eclipse 与 DDD 的 对 比 

Eclipse 也 有 一 些 DDD 所 没有 的 辅助 功能 。 例 如 ，Eclipse 环 境 的 右 侧 是 Outline 视 图 ， 该 视图 中 
列 出 了 变量 、 函 数 等 信息 。 如 果 单 击 函数 scoot _over() 对 应 的 条 目 ， 则 源 文件 视图 中 的 光标 将 会 
移动 到 该 函数 上 。 此 外 ， 如 果 临 时 从 调试 透视 图 移动 回 正在 其 中 对 该 项 目 执 行 编 辑 和 编译 的 
C/C++ 透视 图 (此 处 没有 显示 )， 则 也 可 以 管理 Outline 视 图 。 这 对 于 大 型 项 目 非常 有 帮助 。 

Eclipse 更 好 地 集成 了 编辑 和 编译 过 程 。 如 果 产 生 编 译 错误 ， 则 会 在 编辑 器 中 清楚 地 标记 出 这 
些 错 误 。 可 以 使 用 Vim 编 辑 器 完成 该 操作 , 与 IDE 相 比 , 本 书 的 两 位 作者 都 倾向 于 使 用 Vim 编 辑 器 ， 
但 是 IDE 可 以 更 好 地 执行 该 操作 。 

另 一 方面 ， 可 以 看 到 与 大 多 数 IDE 一 样 ，Eclipse 在 屏幕 (实际 上 是 本 书 中 的 页 面 ) 上 占据 了 
大 量 的 空间 。 无 论 使 用 多 少 ，Outline 视 图 都 会 占据 屏 舌 中 的 宝贵 空间 。 诚 然 ， 可 以 通过 单 击 石 上 
角 的 区 按钮 来 隐藏 Outline 视 图 以 回收 一 些 空 间 〈 如 果 需 要 恢复 显示 该 视图 ， 可 以 选择 Window 一 
Show View 一 Outline)， 也 可 以 将 选项 卡 拖 动 到 Eclipse 窗口 中 的 不 同位 置 。 但 是 一 般 来 说 ， 可 能 很 
难 较 好 地 利用 Eclipse 中 的 屏 贤 空间 。 

记 住 ， 始 终 可 以 直接 在 DDD 的 控制 台中 执行 GDB 命 令 。 因 此 ， 你 可 以 灵活 地 以 最 为 方便 的 
方法 执行 调试 命令 ， 有 时 是 通过 DDD 界 面 ， 而 有 时 则 是 通过 GDB 命 令 行 。 在 本 书 的 不 同 部 分 中 ， 
将 看 到 可 以 使 用 GDB 执 行 大 量 操 作 ， 这 些 操作 可 以 人 简化 调试 工作 。 

通过 对 比 可 以 得 知 ，GDB 对 于 Eclipse 用 户 来 说 基本 是 透明 的 ， 虽 然 过 去 的 说 法 “无 知 即 是 快 
乐 ” 通 常 也 适用 , 但 是 这 种 透明 性 意味 着 你 将 不 能 方便 地 使 用 可 以 通过 直接 利用 GDB 执 行 的 节省 
劳动 量 的 操作 。 在 编写 本 书 时 ,心意 坚决 的 用 户 仍 然 可 以 通过 如 下 方法 直接 访问 GDB: 在 调试 透 
视图 中 单 击 GDB 线 程 ， 然 后 使 用 控制 台 。 但 是 这 种 方法 缺少 GDB 提 示 符 。 然 而 ， 这 种 “未 归档 
的 功能 ”在 将 来 的 版 本 中 可 能 不 再 存在 。 

5. GUI 的 优点 

DDD 和 Eclipse 提供 的 GUI 界面 比 GDB 提 供 的 GUI 界面 的 外 观 更 加 形象 ， 并 且 使 用 起 来 也 更 方 
便 。 例 如 ， 倘 知 不 再 需要 在 get_args() 的 第 16 行 处 暂停 执行 ， 也 束 是 希望 清除 该 位 置 中 的 断 点 ， 
在 GDB 中 ， 可 输入 如 下 命令 来 清除 断 点 。 


(gdb) clear 16 


然而 ， 为 了 执行 该 操 作 ， 需 要 记 住 断 点 所 在 的 行 号 (如 果 同 时 有 许多 有 效 的 断 点 ， 记 住 这 些 
行 写 束 不 容易 )。 可 以 使 用 GDB 的 info _ break 命令 列 出 所 有 断 点 ， 来 重新 记 住所 有 的 行 号 ， 但 是 
这 增加 了 一 定 的 工作 量 ， 并 且 会 分 散 你 得 找 程序 错误 的 注意 力 。 

在 DDD 中 ,你 的 任务 将 会 简单 很 多 : 为 了 清除 断 点 ， 只 需要 单 击 所 需 行 中 的 停止 符号 ， 然 后 
单 击 Clear 按 钮 ， 停 止 符 号 将 会 消失 ， 表 明 已 经 清除 该 断 点 。 

在 Eclipse 中 ， 可 以 进入 Breakpoint 视 网， 突出 显示 需要 删除 的 断 点 ， 然 后 将 鼠标 光标 移动 到 
灰色 的 里 按钮 上 ， 该 按钮 表示 删除 所 选择 断 点 的 操作 ， 如 网 1-4 所 示 。 也 可 以 右 击 源 代 但 宿 口 中 
HT WE CLIE EX JF TE Toggle Breakpoint 命 令 。 

判断 何 种 GUI 可 以 更 为 有 效 地 执行 清除 断 点 工作 的 一 项 任务 是 单 步调 斌 代码。 与 GDB 相 比 ， 
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使 用 DDD 或 Eclipse 可 以 更 加 方便 而 舒适 地 执行 清除 断 点 的 工作 , 因为 可 以 在 GUI 的 源 代 码 窗 口中 
监视 在 代码 中 的 移动 。 通 过 箭头 指示 源 代 但 中 将 要 执行 的 下 一 个 代码 行 ， 如 网 1-$ 中 的 DDD 源 代 
公 窗 口 所 示 。 在 Eclipse 中 ， 以 绿色 突出 显示 要 执行 的 下 一 个 代码 行 。 因此， 可 以 一 眼看 出 目前 相 
对 于 其 他 程序 语句 所 在 的 位 置 。 

6. GDB 的 优点 

综 上 所 述 ， 与 基于 文本 的 GDB 相 比 ， 这 些 GUI 有 许多 优点 。 然 而 ， 根 据 该 示例 就 笼统 地 断定 
GUI 好 于 GDB 并 不 见得 正确 。 

成 长 过 程 中 一 直 使 用 GUI 完成 联机 执行 的 一 切 事 务 的 年 轻 程 序 员 ， 目 然 更 喜欢 使 用 GUI 而 非 
GDB， 很 多 年 纪 大 些 的 程序 员 也 是 如 此 。 但 是 ，GDB 也 有 一 些 突出 的 优点 。 

a GDB 的 启动 速度 比 DDD 快 许多 ， 当 只 需要 快速 检查 代码 中 的 某 项 内 容 时 ， 这 就 是 很 重要 

的 优点 。 在 与 Eclipse 比 较 时 ， 这 种 局 动 时 间 上 的 优势 更 明显 。 

a 在 某 些 情况 下 ， 需 要 从 公共 终端 通过 SSH (或 远程 登录 ) 远程 执行 调试 。 如 果 没 有 安装 
X11， 就 完全 不 能 使 用 GUI， 即 使 有 X11，GUI 的 屏幕 刷新 操作 也 会 非常 缓慢。 

a 当 调 试 彼此 之 间 协 同 操 作 的 多 个 程序 时 〈 例 如， 网络 化 环 声 中 的 客户 /服务 器 程序 )， 束 需 
要 针对 每 个 程序 打开 独立 的 调试 窗口 。 与 DDD 相 比 ，Eclipse 中 的 情况 稍 好 ， 因 为 Eclipse 
允许 在 同一 个 窗口 中 同时 调试 两 个 程序 ， 但 是 这 也 会 带 来 前 面 提 及 的 空间 问题 。 因 此 ， 
与 GUI 占据 大 量 屏幕 空间 相 比 ，GDB 占 据 的 可 视 空间 少 是 很 重要 的 优点 。 

a 如 果 正 在 调试 的 程序 有 GUI， 并 且 使 用 的 是 基于 GUI 的 调试 吉 DDD), WPS z lal wt 
可 能 产生 冲突 。 其 中 某 个 程序 的 GUI 事件 〈 按 键 、 鼠 标 单 击 和 鼠标 移动 )， 可 能 会 干扰 另 

个 程序 的 GUI 事件 , 并 且 被 调试 的 程序 在 调试 器 下 运行 时 可 能 具有 与 独立 运行 时 不 同 的 
行为 。 这 可 能 会 使 查找 程序 错误 变 得 相当 复杂 。 

相 比 于 GUI 中 便利 的 鼠标 操作 ，GDB 所 需 的 大 量 输入 操作 显得 十 分 兵 烦 ， 但 必须 注意 的 是 
GDB 也 包括 一 些 减少 输入 量 的 方法 , 从 而 使 其 基于 文本 的 特性 更 容易 被 用 户 接受 ,本 草 前 面 提 太 ， 
GDB 的 大 多 数 命 令 都 有 简短 的 缩写 方式 ,大 多 数 人 都 使 用 这 种 缩写 方式 而 不 是 完整 的 命令 名 。 同 
FE. 15 A Ctrl+P AI Ctrl+N 2H 4 BE n] EL ju] à. EA BU HI dir 21 E v EEN I RACES m V Hm ZR 
ENTER 键 即 可 重复 发 出 上 一 个 命令 《在 重复 执行 next 命 令 一 次 一 行 地 单 步调 试 代码 时 ， 这 种 方 
法 束 非 党 有 用 ); 此 外 还 有 define 命 令 ， 用 户 可 以 定义 顷 写 和 宏 。 第 2 革 和 第 3 革 将 评 细 介绍 这 些 
功能 。 

7. 总 结 : 每 种 工具 都 有 其 价值 

我 们 认为 GDB 和 GUI 都 是 非常 重要 的 工具 , 并 且 本 书 将 同时 给 出 GDB、DDD 和 Eclipse 的 相关 
示例 。 我 们 将 始终 使 用 GDB 切 入 所 有 主题 ， 因 为 GDB 具 有 这 些 工 具 所 共有 的 特性 ， 然 后 再 将 讨 
论 扩 展 到 GUI。 


1.4.2” 折 中 方法 


从 版 本 6.1 以 来 ，GDB 已 经 以 名 为 TUI (Terminal User Interface， 终 端 用 户 界 面 ) 的 模式 提供 
了 基于 文本 交互 和 图 形 用 户 交 互 之 间 的 折 中 方法 。 在 这 一 模式 中 , GDB 将 终端 屏幕 划分 为 类 似 于 
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DDD 的 源 文 本 窗口 和 控制 台 的 多 个 子 窗口 : 可 以 在 类 似 于 源 文 本 窗口 的 子 窗口 中 跟踪 程序 执行 的 
进展 过 程 ， 同 时 在 类 似 于 控制 台 的 子 窗口 中 发 出 GDB 命 令 。 也 可 以 使 用 另 一 个 程序 CGDB， 它 也 
提供 了 类 似 的 功能 

1. 处 于 TUI 模 式 的 GDB 

为 了 以 TUI 模 式 运 行 GDB， 可 以 在 调用 GDB 时 在 命令 行 上 指定 -tui 选 项 ， 或 者 处 于 非 TUI 模 
式 时 在 GDB 中 使 用 Ctrl+X+A 组 合 键 。 如 果 当 前 处 于 TUI 模 式 ， 后 一 种 命令 方式 束 会 使 你 离开 TUI 
模式 。 

在 TUI 模 式 中 ，GDB 窗 口 划 分 为 两 个 子 窗口 ， 一 个 用 于 输入 GDB 命 令 ， 而 男 一 个 用 于 查看 源 
R. Mixt insert sort 以 TUI 模 式 启 动 GDB， 然 后 执行 儿 个 调试 命令 ，GDB 屏 舌 就 可 能 如 下 
所 示 : 











11 
12 void get args(int ac, char **av) 
13 ( inti; 
14 
15 num inputs = ac - 1; 

* 16 for (i = 0; i < num inputs; i++) 

> 17 x[i] = atoi(av[i+1]); 

18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 
23 for (k = num y-1; k > jj; k++) 

File: ins.c Procedure: get args Line: 17 pc: 0x80484b8 


(gdb) break 16 

Breakpoint 1 at 0x804849f: file ins.c, line 16. 
(gdb) run 12 5 6 

Starting program: /debug/insert sort 12 5 6 


Breakpoint 1, get args (ac-4, av=Oxbffff094) at ins.c:16 
(gdb) next 
(gdb) 


如 果 正 在 使 用 GDB 但 没有 使 用 TUI 模 式 ， 则 位 于 下 方 的 子 窗口 确切 地 显示 你 将 看 到 的 内 容 。 
EAR, YA Dg ard. 
O 有 友 出 一 条 break 命 令 ， 在 当前 源 文件 的 第 16 行 处 设置 断 点 。 
a 执行 un 命令 运行 程序 ， er appa ioe 令 行 参数 12、5 和 6。 在 此 之 后 ， 调 试 右 在 指 
定 的 断 点 处 停止 执行 (后 面 将 介绍 run 和 其 他 GDB 命 令 )。GDB 会 提醒 用 户 断 点 位 于 ins.c 
的 第 16 行 ， 并 且 通 知 该 源 代码 行 的 机 器 代码 驻 旬 加 在 内 存 地 址 ex8e4849f 中 。 
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O 发 出 next 命 令 ， 步 进 到 下 一 个 代码 行 ， 即 第 17 行 。 

上 方 的 子 窗 口 提 供 了 一 些 额 外 的 、 形 象 的 帮助 信息 。 此 处 ， 与 DDD 和 Eclipse 相同 ，TUI 显 示 
了 当前 执行 的 代码 行 上 下 的 其 他 源 人 代码。 这样 束 可 以 更 方便 地 查看 当前 位 于 代码 中 的 位 置 。 分 别 
使 用 星 号 和 > 符号 指示 断 点 和 当前 执行 的 代码 行 ， 这 两 个 符号 分 别 类 似 于 DDD 的 停止 符号 和 绿色 
Bi] 2A o 

通过 使 用 上 下 方向 键 进行 深 动 来 移动 到 代码 的 其 他 部 分 。 如 果 没 有 处 于 TUI 模 式 中 ， 束 可 以 
使 用 箭头 键 来 浏览 以 前 的 GDB 命 令 ， 从 而 修改 或 重复 执行 这 些 命令 。 在 TUI 模 式 中 ， 箭 头 键 用 于 
滚动 源 代 码 子 窗口 ， 可 以 使 用 Ctr+P 和 Ctrl+N 组 合 键 来 浏览 以 前 的 GDB 命 令 。 同 样 ， 在 TUI 模 式 
中 , 可 以 使 用 GDB 的 1ist 命 令 更 改 源 代码 子 窗口 中 显示 的 代码 区 域 。 在 操作 多 个 源 文件 的 情况 下 ， 
该 功能 驶 非常 有 用 。 

通过 使 用 GDB 的 TUI 模 式 和 它 的 输入 快捷 方式 ， 可 以 在 不 受 GUI 不 利 方面 影响 的 情况 下 用 到 
GUI 的 许多 优秀 功能 。 然 而 需要 注意 的 是 ， 在 一 些 情况 下 TUI 可 能 不 能 按照 用 户 所 需要 的 方式 运 
作 ， 这 时 束 需 要 寻找 相应 的 解决 方案 。 

2. CGDB 

2j; —^ HHWIGDBZ-BZECGDB, iZ 7i n] EAM Attp://cgdb.sourceforge.net/Akf3. CGDBi fE 
供 了 一 种 基于 文本 的 方法 与 GUJ 方 法 之 间 的 折 中 方案 。 与 GUI 类 似 ，CGDB 起 GDB 前 端的 作用 。 
CGDB 从 概念 上 类 似 于 基于 终端 的 TUI， 但 它 更 吸引 人 ， 因 为 是 彩色 界面 ， 而 且 可 以 浏览 源 代码 
子 窗口 ， 并 直接 在 子 窗口 中 设置 断 点 。CGDB 处 理 屏 幕 刷 新 的 能 力 似 乎 也 比 GDB/TUI 强 。 

下 和 面 是 CGDB 的 儿 个 基本 命令 与 约定 。 

a 按 下 ESC 键 可 以 从 命令 窗口 转 到 源 代码 窗口 ， 按 下 i 键 返回 。 

a 当 光 标 在 源 代码 窗口 中 时 ， 可 以 用 键 头 键 或 功能 类 似 于 vi 的 键 Gan Iu P» kR HE, 

/表示 查找 ) 在 源 代 码 窗口 中 随意 移动 。 

O 要 执行 的 下 一 行 用 箭头 标记 。 

a 为 了 在 通过 光标 突出 显示 的 当前 代码 行 上 设置 断 点 ， 只 要 按 下 空格 键 即 可 。 

O 断 点 行 的 行 号 用 红色 突出 显示 。 
1.5 ”主要 调试 器 操作 

本 届 概述 调试 器 提供 的 主要 操作 类 型 。 
1.5.1 单 步调 试 源 代码 

前 面 介绍 过 ， 在 GDB 中 是 用 run 命 令 运行 程序 ， 在 DDD 中 是 单 击 Run 按 钮 。 在 后 面 介绍 详细 
内 容 时 ， 可 以 看 到 Eclipse 运行 程序 的 方式 也 是 类 似 的 。 

也 可 以 安排 程序 在 某 个 地 方 暂 停 执 行 ， 以 便 检 查 变量 的 值 ， 寻 求 程 序 错误 所 在 位 置 的 线索 。 
下 面 是 可 用 来 暂停 程序 执行 的 一 些 方法 。 

e Pp S 

正如 前 面 所 提 到 的 ， 调 试 工具 会 在 指定 断 点 处 暂停 程序 的 执行 。 在 GDB 中 是 通过 break 命 令 
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及 源 代 码 行 号 完成 的 ， 在 DDD 中 是 在 相关 代 但 行 的 任意 空白 处 右 击 并 选择 Set Breakpoint 来 完成 
的 ， 在 Eclipse 中 是 在 代码 行 左 边 的 页 边 宇 白 处 双击 完成 的 。 

e 单 步调 试 

表面 提 到 过 ，GDB 的 next 命 令 让 GDB 执 行 下 一 行 ， 然 后 暂停 。step 命 令 的 作用 与 此 类似 ， 
只 是 在 函数 调用 时 step 命 令 会 进入 图 数 ,而 next 导 致 下 一 次 暂停 出 现在 调用 函数 之 后 。DDD 有 对 
应 的 Next 和 Step 荣 单项 ， 而 Eclipse 是 通过 Step Over 和 Step Into 图 标 完 成 这 一 功能 的 。 

e 恢复 操作 

在 GDB 中 ，continue 命 令 通 知 调试 磊 恢复 执行 ， 直 到 遇 到 新 断 点 为 止 。DDD 中 有 一 个 对 应 
的 某 单 项 ，Eclipse 中 有 一 个 Resume 图 标 ， 都 能 完成 这 一 功能 。 

e GAY bp 

在 GDB 中 ，tbreak 命 令 与 break 相 似 ， 但 是 这 一 命令 设置 的 断 点 在 首次 到 达 访 指定 行 后 束 不 
册 有 效 ， 只 使 用 一 次 。 在 DDD 中 临时 断 点 的 设置 方式 为 : 在 源 文本 窗口 中 要 设置 断 点 的 代码 行 的 
任意 空白 处 右 击 ， 然 后 选择 Set Temporary Breakpoint。 在 Eclipse 中 ， 突 出 显示 源 代 但 窗口 中 要 议 
置 断 点 的 代码 行 ， 然 后 右 击 并 选择 Run to Line. 

GDB 中 还 有 创建 特殊 类 型 的 一 次 性 断 点 的 命令 : until 和 finish。DDD 的 命令 工具 中 有 对 应 
的 Until 和 Finish 项 ，Eclipse 中 有 Step Return。 这 些 内 容 将 在 第 2 章 讨 论 。 

程序 执行 的 典型 调试 模式 如 下 《以 GDB 为 例 ): 单 击 一 个 断 点 后 ， 通 过 GDB 的 next 命 令 一 次 
移动 一 行 代码 , 或 通过 step 命 令 单 步调 试 一 段 时 间 , 以 便 仔 细 检 查 靠 近 断 点 处 的 程序 状态 和 行为 。 
做 完 这 些 操 作 后 ， 可 以 用 continue 命 令 让 调试 占 继 续 执 行程 序 ， 直 到 过 到 下 一 个 断 点 为 止 ， 其 间 


个 需要 和 暂停 。 
1.5.2 ”检查 变量 


当 调 试 器 暂停 了 程序 的 执行 后 ， 可 以 执行 一 些 命令 来 显示 程序 变量 的 值 。 这 些 变量 可 以 是 局 
部 变量 、 全 局 变量 、 数 组 的 元 素 和 C 语 言 的 struct、C++ 类 中 的 成 员 变 量 等 。 如 果 发 现 某 个 变量 
有 一 个 出 乎 意料 的 值 , 那 往往 是 找 出 某 个 程序 错误 的 位 置 和 性 质 的 重要 线索 ,DDD 其 至 可 以 用 图 
来 表示 数组 ， 从 而 直观 地 表达 数组 中 的 可 疑 值 或 者 发 生 的 某 种 趋势 。 

最 基本 的 和 变量 显示 类 型 是 仅仅 输出 当前 值 。 例 如 ， 假 设 在 ins.c 中 的 函数 insert() 的 第 37 行 处 
设置 了 一 个 断 点 。( 同 样 ， 完 整 的 源 代 人 码 将 在 1.7 节 中 提供 ， 但 目前 不 需要 关注 细节 。) 当 到 达 这 
一 行 时 ， 可 以 但 看 该 函数 中 局 部 变量 j 的 值 。 在 GDB 中 使 用 print 命 令 输出 当前 值 。 


(gdb) print j 


在 DDD 中 输出 当前 值 的 方法 更 简单 : 只 要 将 鼠标 指针 在 源 文 本 窗口 中 j 的 任 一 实例 上 移动 ， 
等 1~2 秒 后 就 会 在 一 个 靠近 鼠标 指针 的 小 黄 框 《〈《 称 为 值 提示 ) 中 显示 j 的 值 。 图 1-5 显 示 了 被 但 看 
的 变量 new_y 的 值 。Eclipse 的 显示 方式 也 是 如 此 ， 如 图 1-6 所 示 ， 其 中 碍 询 了 num_y 的 值 。 

第 2 章 将 会 介绍 , 在 GDB 或 DDD 中 , 也 可 以 安排 连续 显示 变量 ， 这 样 就 不 必 反 复 要 求人 得 看 值 。 
DDD 有 一 个 特别 优秀 的 功能 ， 可 以 显示 链表 、 树 以 及 其 他 包含 指针 的 数据 结构 : 单 击 这 种 结构 中 
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任 一 节点 的 回 外 链接 即 可 找到 下 一 个 节操 。 
DDD: /home/p/code/InsCorrect.c j0% 


a 7 


上 
Watch Poor Urol. 


27 void insert(int new y) 
int. 5 


(num y == 0) { // y empty so far, easy case 


y[0] = new vy; 
return; 


need to insert just before the first y 
element that new y is less than 
for (j}= 0; j < nun y; j++) f{ 
iE jery <ylil) ( 
shift y[j], v[j*1],... rightward 
// before inserting new y 
scoot overíj); 
yl3] = new y; 
return; 


} 
// if we reach this point, NewY > all existing Y elements 
y[num y] = new vy; 


void process data() 


{ 


for (num y = 0; num y < num inputs; num y++) 
// insert new y in the proper place 
// among y[0],...,y[num y-1] 
insert (x[num_y]); 


Breakpoint 1 at 0x8048450: file InsCorrect.c, line 37. 
(gdb) run 12 5 16.160 1 


Breakpoint 1, insert (new y-5) at InsCorrect.c:37 








1-5 在 DDD 中 查看 变量 


[sv Debug - insert sort/ins.c - Eclipse Platform 


File Edit Refactor Navigate Search Run Project Window Help 
el | ala 


z |E x k 
i /workspace/insert_sort/Debug/insert_sort (12/13/07 6:33 PM) | Value 
Y 加 insert_sort [C/C++ Local Application] 
V È gdb/mi (12/13/07 6:37 PM) (Suspended) 
YV if? Thread [0] (Suspended) 


ess. data() /workspace/insert. sort 


void process, data() 
{ 


for (num_y = 0; num_y < num_inputs; num_y++) 
// insert new y in the proper place 


€ num_inputs : int 

num_y : int 
9 get_args(int, char™) : void 
9 scoot over(int) : void 


then: then/endif not found. 








1-6 在 Eclipse 中 查看 变量 
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1.5.3 在 GDB、DDD 和 Eclipse 中 设置 监视 点 以 应 对 变量 值 的 改变 


监视 点 结合 了 断 点 和 变量 检查 的 概念 。 最 基本 形式 的 监视 点 通知 调试 套 ， 每 当 指 定 变量 的 值 
发 生变 化 时 都 暂停 程序 的 执行 。 
例如 ， 在 程序 执行 期 间 ， 假 设 要 在 变量 z 改 变 值 时 碍 看 程序 的 状态 。 在 GDB 中 ， 可 以 执行 如 


Für. 
(gdb) watch z 


HEF, FAZER ERE, GDB PET. 4EDDD'T, iE CAS fi O H 
单 击 z 的 任 一 实例 来 设置 监视 点 ， 然 后 单 击 DDD 窗 口上 方 的 Watch 疼 标 。 

更 好 的 方法 是 ， 可 以 基于 条 件 表 达 式 来 设置 监视 点 。 例 如 ,假设 要 查找 程序 执行 期 间 z 的 值 
大 于 28 的 第 一 个 位 置 ， 可 以 通过 设置 一 个 基于 表达 式 (z>28) 的 监视 点 来 完成 这 件 事 。 在 GDB 
中 ， 输 入 : 


(gdb) watch (z > 28) 


在 DDD 中 ， 则 是 在 DDD 的 控制 台中 执行 这 一 命令 。 你 一 定 记 得 ，C 语 言 中 表达 式 (z>28) 的 
结果 是 布尔 类 型 ， 计 算得 到 的 值 为 true 或 false， 其 中 false 用 6 表示 ，true 用 任意 非 零 整数 值 表示 ， 
通常 用 1 表示 。 当 z 表 次 变 成 大 于 28 的 值 时 ， 表 达 式 (z>28) 会 从 6 变 成 1，GDB 和 暂停 程序 的 执行 。 

在 Eclipse 中 设置 监视 点 的 方法 为 : 在 源 代 人 码 窗 口中 点 击 忌 标 右键 ， 选 择 Add a Watch 
Expression， 然 后 在 对 话 框 中 填写 适当 的 表达 式 。 

监视 点 对 局 部 变量 的 用 途 一 般 没 有 对 作用 域 更 宽 的 变量 的 用 途 大 , 因为 一 旦 变量 超出 作用 域 
《 即 当 在 其 中 定义 变量 的 函数 结束 时 )， 在 局 部 变量 上 设置 的 监视 点 就 会 被 取消 。 然 而 ，main() 
中 的 局 部 变量 显然 是 一 个 例外 ， 因 为 这 样 的 变量 只 有 程序 执行 完 时 才 会 被 释放 。 


1.5.4 上 下 移动 调用 梳 


在 函数 调用 期 间 ， 与 调用 关联 的 运行 时 信息 存储 在 称 为 栈 帧 (stack frame) 的 内 存 区 域 中 。 
帧 中 包含 函数 的 局 部 变量 的 值 ， 函 数 的 形 参 ， 以 及 调用 访 函 数 的 位 置 的 记录 。 每 次 友 生 函数 调用 
时 ， 都 会 创建 一 个 新 帧 ， 并 将 其 推 到 一 个 系统 维护 的 栈 上 ;， 栈 最 上 方 的 帧 表示 当前 正在 执行 的 函 
数 ， 当 函数 退出 时 ， 这 个 帆 被 弹出 栈 ， 并 且 衫 释放 。 

例如 ， 在 insert() 函 数 中 暂停 示例 程序 insert sort 的 执行 。 当 前 栈 帧 中 的 数据 会 指出 ， 你 通 
过 在 一 个 恰好 位 于 process_data() 函 数 〈 该 函数 调用 insert()) 中 的 特定 位 置 进行 的 函数 调用 到 
达 了 这 个 帧 。 这 个 帆 也 会 存储 insert() 的 唯一 局 部 变量 的 当前 值 ， 稍 后 你 会 发 现 这 个 值 为 j。 

其 他 活动 图 数 调 用 的 栈 帧 将 包含 类 似 的 信息 ， 如 果 你 愿意 ， 也 可 以 奏 看 它们 。 例 如 ， 尽 管 程 
序 的 执行 当前 位 于 insert() 内 ,但 是 你 也 可 能 希望 可 看 调用 栈 中 以 前 的 帧 , 即 奋 看 process_data( ) 
的 帆 。 在 GDB 中 可 以 用 如 下 命令 但 看 以 前 的 巾 。 


(gdb) frame 1 
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当 执 行 GDB 的 frame 命 令 时 ， 当 前 正在 执行 的 水 数 的 帆 补 编写 为 0， 其 父 帧 ( 即 该 函数 的 调用 
ARW) 被 编号 为 1， 父 帆 的 父 帧 被 编号 为 2， 以 此 类 推 。GDB 的 up 命令 将 你 市 到 调用 栈 中 的 下 
一 个 父 帆 〈 例 如 ， 从 巾 0 到 帆 1)，down 则 3 引 各 相反 方 回 。 这 样 的 操作 非常 有 用 ， 因 为 根据 以 前 的 
一 部 分 栈 帧 中 的 局 部 变量 的 值 ， 可 能 发 现 程序 错误 的 线索 。 

裔 历 调 用 栈 不 会 修改 执行 路 人 笃 〈 在 本 例 中 ， 要 执行 的 insert_sort 的 下 一 行 仍然 会 是 insert() 
中 的 当前 行 )， 但 是 它 确 实 允 许 得 看 帧 的 祖先 帆 ， 因 此 可 以 检查 通 癌 当前 帆 的 各 次 函数 调用 的 局 
部 变量 的 值 。 同 样 ， 这 可 以 提示 你 从 何 处 得 找 程序 错误 。 

GDB 的 backtrace 命 令 会 显示 整个 栈 ， 即 当前 存在 的 所 有 帧 的 集合 。 

DDD 中 的 类 似 操作 通过 Status 一 Backtrace 完 成 ， 这 样 做 会 弹出 一 个 显示 所 有 帧 的 窗口 ， 然 后 
可 以 单 击 要 答 看 的 任何 一 个 帧 。DDD 界 面 也 有 Up 和 Down 按 钮 ， 单 击 这 两 个 按钮 可 以 执行 GDB 的 
up 和 down 命 令 。 

在 Eclipse 中 ， 栈 在 Debug 透 视图 本 里 中 连续 可 见 。 在 图 1-7 中 ， 查 看 左上 和 角 的 Debug 选 项 卡 ， 
可 以 看 出 我 们 目前 在 函数 get_args() 的 第 2 帧 中 ， 这 个 函数 是 从 main() 中 的 第 1 帧 调用 的 。 突 出 显 
未 的 古 源 代码 窗口 中 显示 的 那 一 帧 ， 因 此 可 以 通过 在 调用 栈 中 单 击 来 显示 任 一 帧 。 
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for (i = 0; i < num inputs; i++) 
printf("%d\n",y[i]); 
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print. results(); 
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1.6 联机 帮助 
在 GDB 中 ， 可 以 通过 help 命 令 访问 文档 。 例 如 ， 


(gdb) help breakpoints 
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将 显示 关于 断 点 的 文档 。 不 带 参 数 的 GDB 命 令 help 可 显示 一 个 菜单 列 出 可 用 来 作为 help 的 参数 
的 命令 类 别 。 


在 DDD 和 Eclipse 中 ， 可 通过 单 击 Help 获 得 大 量 信息 。 
1.7. Sm Wu 


现在 我 们 将 提供 一 个 完整 的 调 斌 会话。 前面 说 过 ， 示 例 程序 在 源 文件 ins.c 中 ， 它 实现 插入 排 
友 。 当 然 ， 这 种 排序 方法 效率 不 帅 ， 但 是 其 代码 比较 人 简单， 有 利于 说 明 调 试 操 作 ， 代 码 如 下 。 

// 

// insertion sort, several errors 

ny 


// usage: insert sort numi num2 num3 ..., where the numi are the numbers to 
// be sorted 











int x[10], // input array 
y[10], // workspace array 
num inputs, // length of input array 
num y = 0; // current number of elements in y 


void get args(int ac, char *xav) 
( inti; 


num inputs - ac - 1; 
for (i = 0; i « num inputs; i++) 
x[i] = atoi(av[i+1]); 
1 


void scoot over(int jj) 
{ int k; 


void insert(int new y) 
t int j; 


if (num y = 0) { // y empty so far, easy case 
y[o] = new y; 
return; 

} 

// need to insert just before the first y 

// element that new y is less than 
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for (j = 0; j < num y; je) { 
if (new y < ylj]) 1 
// shift y[j], y[j+i],... rightward 
// before inserting new y 
scoot over(j); 


vlail = new v: 
yiJ] = new BT 





return; 
} 
} 
} 
void process data() 
{ 
for (num y = 0; num y < num inputs; num yc) 
// insert new y in the proper place 
// among y[0],...,y[num y-1] 
insert(x[num y]); 
} 


void print results() 
i inti; 


for (i = 0; i « num inputs; i++) 
printf("dNn",y[i]); 
j 


int main(int argc, char ** argv) 
{ get_args(argc, argv); 

process data(); 

print results(); 


} 


下 和 面 是 这 段 程 序 的 一 个 伪 人 码 描述 。 用 call 语 句 表示 函数 调用 ， 各 个 函数 的 伪 人 码 在 这 些 调用 下 
面 缩 进 显示 。 


call main(): 
set y array to empty 
call get args(): 
get num inputs numbers x[i] from command line 





call process data(): 
for i - 1 to num inputs 
call insert(x[i]): 
new y - x[i] 
find first y[j] for which new y < y[jl 
call scoot over(j): 


18 € 13x 预备 知识 


shift y[j], y[j*1], ... to right, 
to make room for new y 
set y[j] = new y 


让 我 们 编 详 并 运行 代码 。 


$ gcc -g -Wall -o insert sort ins.c 





注意 ,在 GCC 中 可 以 用 -g 选 项 让 编译 器 将 符号 表 ( 即 对 应 于 程序 的 变量 和 代码 行 的 内 存 地 址 
列表 ) 保存 在 生成 的 可 执行 文件 (这 里 是 insert sort) 中 。 这 是 一 个 绝对 必要 的 步 又， 这 样 才 能 
在 调试 会 话 过 程 中 引用 源 代码 中 的 变量 名 和 行 写 。 如 果 没 有 这 一 步 ( 要 是 使 用 的 编 详 右 不 是 GCC， 
则 必须 做 一 些 类 似 的 操作 )， 束 不 能 要 求 调试 磊 “ 在 第 30 行 处 集 止 ”或 者 “输出 x 的 值 ”。 

现在 让 我 们 运行 该 程序 。 根 据 1.3.3 节 介绍 的 从 简单 工作 开始 调试 的 原则 ， 首 先 尝 试 排序 一 个 
只 有 两 个 数 的 列表 。 


$ insert sort 12 5 
(execution halted by user hitting ctrl-C) 




















该 程序 没有 终止 ， 也 没有 输出 任何 内 容 。 它 显然 进入 了 一 个 无 限 循环 ， 必 须 按 下 Ctrl+C 组 合 
键 来 终止 这 个 循环 。 诸 无 疑问 ， 肯 定 有 什么 地 方 出 了 问题 。 

E FEJLER, 我 们 首先 用 GDB 提 供 一 个 调试 会 话 来 调试 这 个 有 错误 的 程序 , 然后 讨论 如 何 
用 DDD 和 Eclipse 进行 这 种 调试 。 
1.7.1 GDB 方 法 


为 了 跟踪 第 一 个 程序 错误 ， 在 GDB 中 执行 这 个 程序 ， 并 在 按 Ctrl+C 组 合 键 挂 起 程序 之 前 让 和 它 
运行 一 会 儿 。 然 后 看 看 这 时 停留 在 何 处 。 用 这 种 方式 可 以 确定 无 限 循环 的 位 置 。 
首先 ， 对 zsert sort 局 动 GDB 调 试 絮 。 




















$ gdb insert sort -tui 








X HT BERE NAHE P o 


63 { get args(argc,argv); 
64 process data(); 

65 print results(); 

66 ) 


69 
File: ins.c Procedure: ?? Line: ?? pc: ?? 











-E TR H5) 3 LA ns Y BEAT UST. 在 下 面 的 子 窗口 中 有 等 每 输入 命令 的 GDB 提 示人 符 ， 还 有 一 
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条 GDB 欢 迎 消 县 ， 为 了 简化 起 见 ， 我 们 省 略 了 这 条 消息 。 

如 果 在 调用 GDB 时 没有 请 求 TUI 模 式 ， 那么 只 会 收 到 欢迎 消息 和 GDB 提 示 符 ， 不 会 出 现 上 面 
的 程序 源 代码 子 窗口 。 可 以 用 GDB 的 命令 Ctrl+X+A 组 合 键 进入 TUI 模 式 。 这 个 命令 用 来 打开 或 关 
闭 TUI 模 式 。 如 果 你 愿意 ， 可 以 用 该 命令 临时 离开 TUI 模 式 ， 从 而 更 方便 地 阅读 GDB 的 联机 帮助 ， 
或 者 在 同一 个 屏幕 上 和 查看 用 过 的 更 多 GDB 命 令 。 

现在 从 GDB 中 执行 un 命令 以 及 程序 的 命令 行 参数 来 运行 该 程序 ， 然 后 按 Ctrl+C 组 合 键 挂 起 
它 。 屏 幕 现 在 如 下 所 示 。 

















46 

47 void process data() 

48 { 

49 for (num y = 0; num y < num inputs; num y++) 


50 // insert new y in the proper place 
51 // among y[0],...,y[num y-1] 
» 52 insert(x[num y]); 
53 i 
54 
55 void print results() 
56 { int i; 


No 


58 for (i = 0; i < num inputs; i++) 
59 printf("%d\n" ,y[il); 
60 } . 
File: ins.c Procedure: process data Line: 52 pc: 0x8048483 


(gdb) run 12 5 
Starting program: /debug/insert sort 12 5 


Program received signal SIGINT, Interrupt. 
0x08048483 in process data () at ins.c:52 
(gdb) 


该 屏幕 表明 ， 当 停止 程序 时 ，insert sort 在 函数 process_data() 中 ， 即 将 执行 源 文件 ins.c 的 第 52 行 。 

我 们 随机 按 下 Ctrlt+C 组 合 键 ， 并 在 代码 中 的 任意 位 置 停止 。 有 时 最 好 挂 起 并 重 局 停止 了 两 到 
三 次 啊 应 的 程序 ， 方 法 是 在 两 次 按 下 Ctrl+C 组 合 键 之 间 执 行 continue 命 令 ， 以 便 碍 看 每 次 是 在 何 
处 停止 的 。 

现在 ， 第 52 行 是 从 第 49 行 开始 的 循环 的 一 部 分 。 这 个 循环 是 否 为 无 限 循环 呢 ? 这 个 循环 似乎 
不 应 当 无 限 地 循环 ,但 是 确认 原则 表明 ， 应 该 验证 一 下 ,不 要 想当然 。 如 果 因 为 你 不 知 何故 没有 
正确 地 设置 变量 num_y 的 上 边界 ， 导 致 循环 没有 终止 ， 那 么 当 程序 运行 了 一 段 时 间 后 ，num_y 的 值 
将 相当 大 。 是 吧 ? 《同样 ， 看 上 去 似乎 不 会 ， 但 是 需要 确认 一 下 。) 下面 我 们 查看 一 下 GDB 输 出 
的 num_y 值 。 
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(gdb) print num y 
31-1 


这 一 查询 的 输出 表明 num_y 的 值 为 1 。$1 标 签 意 味 着 这 是 你 要 求 GDB 输 出 的 第 一 个 值 。($1、 
$2、g$3 等 表示 的 值 统 称 为 调试 会 话 的 值 历史 。 后 面 的 章节 中 你 会 看 到 ， 会 话 的 值 历史 非常 有 用 。) 
因此 我 们 似乎 仅 在 该 循环 的 第 二 个 迭代 上 ， 即 第 49 行 。 如 果 这 个 循环 是 无 限 循 环 ， 那 么 到 这 时 为 
LEIA A LEE IER 

那么 ， 让 我 们 仔细 看 一 下 当 num_y 为 1 时 发 生 的 事情 。 通知 GDB 在 循环 的 第 二 次 迭代 期 间 ， 在 
第 49 行 处 的 insert() 中 停止 ， 以 便 查 看 情况 ， 尝 试 找 出 程序 这 时 在 这 个 位 置 出 了 什么 问题 。 

(gdb) break 30 


Breakpoint 1 at Ox80483fc: file ins.c, line 30. 
(gdb) condition 1 num y==1 


























第 一 个 命令 在 第 30 行 处 〈 即 在 insert() 的 开头 ) 放置 一 个 断 点 。 另 外 ， 可 以 通过 命令 break 
insert 指 定 这 个 断 点 ， 即 在 insert() 的 第 一 行 处 中 断 〈 这 里 是 第 30 行 )。 后 一 种 形式 有 一 个 优点 : 
如 果 修 改 了 程序 代码 ， 使 得 函数 insert() 不 再 在 ins.c 的 第 30 行 处 开始 ， 那 么 如 果 用 函数 名 指定 断 
点 ， 而 不 是 用 行 号 指定 ， 则 汤 点 仍然 有 效 。 

break 命 令 一 般 会 使 得 每 次 程序 执行 到 指定 行 时 都 会 暂停 。 然 而 ， 这 里 的 第 二 个 命令 
condition 1 num_y==1 使 得 该 断 点 成 为 有 条 件 的 断 点 : 只 有 当 满 足 条 件 num_y==1 时 ，GDB 才 会 在 
打点 1 处 暂停 程序 的 执行 。 

注意 ， 与 接受 行 号 《或 函数 名 ) 的 break 命 令 不 同 ，condition 接 受 断 点 号 。 总 是 可 以 用 命令 
info break 来 咎 询 要 得 找 的 断 点 的 编号 。( 访 命令 也 提供 了 其 他 有 用 信息 ， 比 如 到 目前 为 止 过 到 
各 个 断 点 的 次 数 。) 

用 break if 可 以 将 break 和 condition 命 令 组 合成 一 个 步骤 ， 如 下 所 示 。 














(gdb) break 30 if num y--1 














然后 用 run 命 令 再 次 运行 程序 。 如 果 要 重用 老 的 命令 行 参数 ， 就 不 必 再 次 指定 命令 行 参数 。 
这 里 就 是 这 种 情况 ， 可 以 简单 地 输入 run。 由 于 程序 已 经 在 运行 ， 因 此 GDB 询 问 是 否 希望 重新 从 
头 开始 ， 请 回答 “是 ”。 

















屏 硕 这 时 将 如 下 所 示 。 
24 ylk] = ylk-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
*> 30 if (num y = 0) { // y empty so far, easy case 
31 y[o] = new_y; 


32 return; 
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33 } 
34 // need to insert just before the first y a 
35 // element that new y is less than 
36 for (j = 0; j < nm y; j++) { 
37 if (new y < y[j]) { 
38 // shift y[j], y[jtt],... rightward 
File: ins.c Procedure: insert Line: 30 pc: 0x80483fc 


(gdb) condition 1 num y--1 

(gdb) run 

The program being debugged has been started already. 
Start it from the beginning? (y or n) 

Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y=5) at ins.c:30 
(gdb) 


我 们 再 次 应 用 确认 原则 : 因为 num_y 为 1， 所 以 应 跳 过 第 31 行 ， 直 接 执行 第 36 行 。 但 是 我 们 需 
要 确认 这 一 点 ， 因 此 执行 next 命 令 来 继续 执行 下 一 行 。 


24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
* 30 if (num y = 0) ( // y empty so far, easy case 
31 y[o] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
» 36 for (j = 0; j < num y; j++) { 
37 if (new y < y[j]) { 
38 // shift y[j], yLjr1],... rightward 
File: ins.c Procedure: insert Line: 36 pc: 0x8048406 
(gdb) run 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 
(gdb) next 
(gdb) 
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上 和 面 的 子 窗口 中 的 箭头 现在 位 于 第 36 行 ， 因 此 确认 了 我 们 的 预料 ， 我 们 确实 跳 过 了 第 31 行 。 
现在 让 我 们 继续 单 步调 试 程序 ， 依 次 确认 关于 这 段 代码 的 假设 。 由 于 现在 位 于 循环 的 开 尖 ， 因 此 
再 执行 儿 次 next 命 令 来 逐 行 租 看 循环 的 进展 。 


39 // before inserting new y 
40 scoot over(j); 
41 y[j] = new y; 
42 return; 
43 } 
44 } 

> 45 } 
46 
47 void process data() 
48 { 
49 for (num y = 0; num y < num inputs; num y++) 
50 // insert new y in the proper place 
51 // among y[0],...,y[num y-1] 
52 insert(x[num y]); 
53 } 

File: ins.c Procedure: insert Line: 45 pc: 0x804844d 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 


Breakpoint 1, insert (new y=5) at ins.c:30 
(gdb) next 

(gdb) next 

(gdb) 


看 一 下 上 面 的 子 窗口 中 箭头 现在 位 于 何 处 一 一 我 们 直接 从 第 37 行 跳 到 了 第 4$ 行 ! 这 种 情况 让 
人 人 大吃一惊， 这 个 循环 一 次 迭代 都 没有 执行 。 不 过 要 记 住 ， 这 种 惊讶 是 好 事 ， 因 为 它们 提供 了 关 
于 程序 错误 在 何 处 的 线索 。 

该 循环 在 第 36 行 处 根本 不 执行 迭代 的 唯一 原因 是 : 即使 当 j 为 0 时 ， 第 36 行 的 条 件 j<num_y 也 
不 成 立 。 然 而 你 知道 (至 少 你 认为 你 知道 ) num_y 为 1， 因 为 在 该 断 点 上 施加 了 条 件 num_y==1 后 ， 




















你 现在 位 于 该 函数 中 。 同 样 ， 还 没有 人 确认 这 一 点 。 现 在 检查 一 下 。 
(gdb) print num y 
$2 = 0 


本 无 颖 问 ， 虽 然 进 入 insert() 时 不 满足 num_y==1 这 一 条 件 ， 但 是 显然 从 那 时 起 num_y 已 经 改 
变 。 当 进入 这 个 函数 后 ，num_y 变 成 了 0。 但 是 如 何 变 的 呢 ? 
前 面 说 过 ， 确 认 原 则 不 会 告诉 你 程序 错误 是 什么 ,但 是 它 提供 了 程序 错误 可 能 位 于 何 处 的 线 
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索 。 在 本 例 中 ， 现 在 发 现 了 程序 错误 的 位 置 在 第 30 行 和 第 36 行 之 间 的 某 处 。 可 以 进一步 缩小 其 范 
围 ， 因 为 你 看 到 第 31 行 到 第 33 行 被 跳 过 了 ， 第 34 行 到 第 3$ 行 是 注释 。 换 言 之 ， 要 么 在 第 30 行 ， 要 
么 在 第 36 行 ，num_y 中 的 值 发 生 了 神秘 的 变化 。 

在 进行 短暂 的 休息 (这 往往 是 最 佳 调试 策略 !) 之 后 , 我 们 突然 意识 到 这 个 问题 是 C 程 序 员 新 
手 常 犯 的 一 个 典型 错误 《有 经 验 的 程序 员 有 时 也 会 狠 狐 地 犯 这 个 错误 ): 在 第 30 行 我 们 用 =， 而 不 
征 ==， 把 一 次 相等 测试 变 成 了 一 个 赋值 操作 。 

明日 了 吗 ? 因 为 这 个 原因 ， 所 以 产生 了 无 限 循 坏 。 第 30 行 的 错误 产生 了 一 种 无 休止 的 拉锯 式 
情况 ， 第 49 行 的 num_y++ 部 分 让 num_y 友 复 地 从 0 递增 到 1， 而 第 30 行 的 错误 反复 地 将 该 变量 的 值 义 
设置 为 0。 

因此 我 们 修复 了 这 个 比较 丢脸 的 程序 错误 ， 重 新 编 详 ， 并 绸 次 运行 程序 。 

$ insert sort 12 5 


5 
0 


虽然 我 们 不 再 有 无 限 循环 了 ， 但 是 仍然 没有 得 到 正确 的 输出 。 

从 前 面 描述 程序 功能 的 伪 码 中 可 以 看 出 : 最 初 数组 y 应 该 是 空 的 ， 循 环 在 第 49 行 的 第 一 次 迭 
代 应 该 将 12 放 到 y[e6] 中 ， 然 后 在 第 二 次 达 代 中 12 应 移动 一 个 数组 位 首 ， 为 插入 5 腾 出 空间 。 然 而 ， 
SSE ES PTH J 12. 

问题 出 在 第 三 个 数 子 5) E, EMA RRR RC AA Ba ee ae PE PE 
GDB 会 话 中 ， 而 没有 在 发 现 和 修复 第 一 个 程序 错误 后 退出 GDB， 上 所 以 我 们 以 前 设置 的 断 点 及 其 
条 件 现在 仍然 有 效 。 因 此 只 要 再 次 运行 程序 ， 当 程序 开始 处 理 第 二 个 输入 时 停止。 










































































24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 i int j; 
29 
*> 30 if (num y == 0) { // y empty so far, easy case 
31 y[0] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < nm y; j+) { 
37 if (new y < y[j]) { 
38 // shift y[j], y[j*1],... rightward 
File: ins.c Procedure: insert Line: 30 pc: 0x80483fc 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
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"/debug/insert sort' has changed; re-reading symbols. 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 
(gdb) 


注意 如 下 这 行 代 码 。 
"/debug/insert sort' has changed; re-reading symbols. 


iU 7RGDB ACAD] gr VE Y FEF, 在 运行 程序 之 前 目 动 重新 加 载 了 新 的 三 分 表 和 新 的 符 
写 表 。 

我 们 在 重新 编译 程序 之 前 仍然 不 必 退 出 GDB .这样 做 之 所 以 提供 了 很 大 的 方便 ,有 儿 个 原因 。 
第 一 ， 不 需要 重新 指出 命令 行 参数 ， 只 要 键入 run 重 新 运行 程序 即 可 。 其 次 ，GDB 保 留 了 你 设置 
的 断 点 ， 因 此 不 需要 再 次 键入 它 。 虽 然 这 里 只 有 一 个 断 点 ， 但 很 多 情况 下 会 有 多 个 断 点 ， 因 此 这 
样 省 了 不 少 事 。 这 些 便利 减少 了 键入 操作 ， 更 重要 的 是 它们 减少 了 对 机 械 操 作 的 分 心 ， 可 以 更 好 
HK AH J SEP SE bas ali Eo 

同样 ， 在 调试 会 话 期 间 不 要 退出 再 重 局 文本 编辑 占 ， 这 件 事 也 会 分 心 而 且 浪 费时 间 。 只 要 将 
文本 编辑 器 放 在 一 个 窗口 中 ，GDB (或 DDD)〉 放 在 为 一 个 窗口 中 ， 用 第 三 个 窗口 调试 程序 即 可 。 

现在 让 我 们 再 次 尝试 单 步 调试 代码 。 与 以 前 一 样 ， 程序 应 该 跳 过 第 31 行 ,但 是 与 前 面 的 情况 
不 同 的 是 ， 这 次 它 有 布 望 到 达 第 37 行 。 我 们 通过 执行 next 命 令 两 次 来 检举 这 一 氮 。 















































31 y[O] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < num y; j++) { 
> 37 if (new y < y[j]) { 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new y 
40 scoot_over(j); 
41 y[j] = new y; 
42 return; 
43 ) 
44 } 
45 } 
File: ins.c Procedure: insert Line: 37 pc: 0x8048423 


"/debug/insert sort' has changed; re-reading symbols. 


cL. i aa, ec veg 


— A n p 2 fale E art o Dom aa^ r 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 
(gdb) next 


1.7 初 涉 调 试 会 话 25 


(gdb) next 
(gdb) 


我 们 真 的 到 达 了 第 37 行 。 

这 时 ， 我 们 认为 第 37 行 的 计 中 的 条 件 应 当成 这， 因为 new_y 应 为 5， 并 且 第 一 次 迭代 结束 y[e8] 
应 为 12。GDB 的 输出 确认 了 前 一 个 假设 ， 下 面 检 查 后 一 个 假设 。 

(gdb) print y[o] 

$3 - 12 

这 个 假设 也 得 到 了 确认 , 然后 执行 next 命 令 , 它 将 你 带 a 到 第 40 行 ,我 们 预期 函数 scoot_over() 
将 12 移 到 下 一 个 数组 位 置 处 ， 为 $ 腾 出 空间 。 你 应 该 得 看 它 有 没有 完成 这 件 事 。 这 时 面临 一 个 重 
要 选择 。 你 可 以 再 次 执行 next 命 令 ， 使 得 GDB 在 第 41 行 处 俘 止 ;函数 scoot _over() 会 被 执行， 但 
是 GDB 不 会 在 该 函数 中 人 停止。 然而， 如果 你 执行 的 是 step 命 令 ，GDB 就 会 在 第 23 行 停止 ， 这 样 
会 允许 在 scoot_over() 中 单 步 调试 。 

采用 1.3.3 节 介绍 的 目 顶 回 下 的 调试 方法 ， 我们 在 第 40 行 选择 next 命 令 ， 而 不 是 step 命 令 。 当 
GDB 在 第 41 行 停止 时 ， 可 以 看 一 下 y 值 ， 检 得 函数 有 没有 正确 地 完成 其 工作 。 如 果 确 认 了 这 一 假 
设 ， 就 不 必 浪 费时 间 查 看 对 修复 当前 程序 错误 没有 用 处 的 冰 数 scoot_over() 的 详细 操作 。 如 果 没 
有 能 够 确认 , 可 以 再 次 在 调试 器 中 运行 该 程序 , 并 使 用 step 进 入 函数 , 以便 检查 函数 的 详细 操作 ， 
以 期 确定 何 处 出 了 问题 。 

因此 ， 当 达到 第 40 行 时 ， 键 入 next， 产 生 : 






































31 ylo] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < num y; jt) { 
37 if (new y < y[3]) 1 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new_y 
40 scoot over(j); 
> 41 ylj] = new y; 
42 return; 
43 j 
44 } 
45 } 
File: ins.c Procedure: insert Line: 41 pc: 0x8048440 
(gdb) next 
(gdb) next 


(gdb) 
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scoot over() 有 没有 正确 地 移动 12? 让 我 们 看 一 下 。 


(gdb) print y 
$4 = (12, 0, 0, 0, 0, 0, 0, 0, 0, 0} 


显然 没有 。 问 题 实 际 上 出 现在 scoot_over() 中 。 我 们 删除 insert() 开 头 的 断 点 ， 并 在 
scoot_over() 中 放置 一 个 断 点 ， 同 样 采 用 一 个 可 在 第 49 行 的 第 二 次 欠 代 时 停止 的 条 件 。 


(gdb) clea 30 

Deleted breakpoint 1 

(gdb) break 23 

Breakpoint 2 at 0x80483c3: file ins.c, line 23. 
(gdb) condition 2 num y--1 











现在 再 次 运行 程序 。 


15 num inputs = ac - 1; 
16 for (i = 0; i < num inputs; i++) 
17 x[i] = atoi(av[i+1]); 
18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 
*» 23 for (k = num y-1; k > jj; k++) 
24 ylk] = y[k-1]; 
25 i 
26 
27 void insert(int new y) 
28 { int j; 
29 
File: ins.c Procedure: scoot over Line: 23 pc: 0x80483c3 


(gdb) condition 2 num y--1 

(gdb) run 

The program being debugged has been started already. 
Start it from the beginning? (y or n) 

Starting program: /debug/insert sort 12 5 


Breakpoint 2, scoot over (jj=0) at ins.c:23 
(gdb) 


FRR EEA UR A JU]: 想 一 下 你 预期 会 发 生 什 么 情况 ,然后 尝试 确认 确实 发 生 了 这 种 情况 。 在 
这 个 例子 中 ， 我 们 认为 函数 会 将 12 移 到 数组 y 中 的 下 一 个 位 置 ， 这 总 味 看 第 23 行 的 循环 应 当 恰 好 
通过 一 次 迭代 。 让 我 们 通过 重复 执行 next 命 令 来 单 步 调试 该 程序 ， 以 便 确 认 这 种 预期 。 
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15 num inputs = ac - 1; 
16 for (i = 0; i« num inputs; i++) 
17 x[i] = atoi(av[i+1]); 
18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 

* 23 for (k = num y-1; k > jj; k++) 
24 y[k] = y[k-1]; 

» 25 ) 

26 
27 void insert(int new y) 
28 { int j; 
29 

File: ins.c Procedure: scoot over Line: 25 pc: 0x80483f1 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 


Breakpoint 2, scoot_over (jj=0) at ins.c:23 
(gdb) next 
(gdb) next 


(gdb) 


这 里 我 们 再 次 恢 订 地 发 现 : 我 们 现在 位 于 第 25 行 ,其 全 部 没 有 页 到 第 24 行 一 一 循环 没有 执行 
从 代 ， 我 们 预期 会 执行 的 迭代 一 次 也 没有 执行 。 显 然 第 23 行 有 一 个 程序 错误 。 

正如 前 面 那 个 出 乎 意料 地 没有 对 循环 体 执 行 一 次 欠 代 的 循环 , 肯定 是 在 循环 的 一 开始 就 没有 
满足 循环 条 件 。 这 里 是 不 是 这 种 情况 呢 ? 第 23 行 的 循环 条 件 是 k>jj。 我 们 从 这 一 行 中 还 知道 了 k 
的 初始 值 是 num_y-1， 我 们 从 断 点 条 件 知道 后 者 的 量 为 0。 了 最 后 ，GDB 屏 关 告 诉 我 们 ，j 订 为 0。 
此 当 循 环 开始 时 条 件 k>jj 没 有 得 到 满足 。 

因此 ， 我 们 要 么 错误 地 指定 了 循环 条 件 k>jj， 要 么 错误 初始 化 成 了 k=num_y-1。 我 们 认为 在 
循环 的 第 一 次 也 是 唯一 的 一 次 欠 代 中 , 应 将 12 从 y[8] 移 到 y[1]( 即 第 24 行 应 当 在 k=1 时 已 经 执行 )， 
我 们 蕊 识 到 循环 初始 化 错 了 ， 应 该 是 k=num_y。 

修复 这 个 错误 ， 重 新 编 详 程 序 ， 再 次 运行 程序 〈 在 GDB 之 外 )。 

$ insert sort 12 5 

Segmentation fault 


"uer FEED BRIAN CVE A FEIN, MERRER COA EKG EAR SP ZS Do Jak ASE 
征 由 于 数组 索引 超出 了 边界 ， 或 者 采用 了 错误 的 指针 值 。 段 错误 也 可 能 由 没有 显 式 地 包含 指针 或 
数组 变量 的 内 存 引 用 产生 。 这 种 情况 可 以 从 C 程 序 员 蜗 犯 的 另 一 个 典型 错误 中 看 出 ， 比 如 ， 古 记 
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在 用 按 引 用 调用 传递 的 函数 形 参 中 加 上 &， 写 成 了 : 

scanf("%d" ,x); 
而 不 是 

scanf(" Xd" ,&x); 

Ar. GDBEKDDDIX FF AY JAVA LH. H E BEM oe f AUS ub ig R3 45 E BEE, 

但 是 对 于 段 错 误 ， 调 试 工具 提供 了 额外 、 切 实 、 即 时 的 帮助 : 它 指 出 在 程序 中 何 处 出 现 了 错 
IRo 

为 了 利用 这 一 点 ， 需 要 在 GDB 中 运行 insert sort， 并 重 现 段 错 误 。 首 先 ， 删 除 断 点 。 正 如 六 
面 见 到 的 ， 要 做 到 这 一 点 ， 需 要 给 出 断 点 的 行 号 。 你 可 能 已 经 记 住 了 行 写 , 但 是 要 但 找 起 来 也 很 
容易 : 可 以 深 动 TUI 窗 口 ( 用 上 下 季 头 键 )， 会 找 用 星 写 标记 的 行 ， 或 者 用 GDB 的 info break 命 
令 来 人 查找。 然后 用 clear 命 令 删 除 断 点 。 


(gdb) clear 30 


























现在 再 次 在 GDB 中 运行 程序 。 


19 
20 void scoot over(int jj) 
21 { int k; 
22 
23 for (k = num y; k > jj; k++) 

» 24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
30 if (num y == 0) { // y empty so far, easy case 
31 y[0] = new y; 

File: ins.c Procedure: scoot_over Line: 24 pc: 0x8048538 


Start it from the beginning? (y or n) 


"/debug/insert sort' has changed; re-reading symbols. 
Starting program: /debug/insert sort 12 5 


Program received signal SIGSEGV, Segmentation fault. 
0x08048538 in scoot over (jj=0) at ins.c:24 
(gdb) 


不 出 所 料 , GDB 告 诉 了 我 们 段 错 误 发 生 的 确切 位 置 , 即 在 第 24 行 , 肯定 与 一 个 数组 索引 有 大 ， 
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也 束 是 k。 要 么 是 k 太 大 了 ， 超 过 了 y 中 的 数组 个 数 ， 要 么 k-1 是 负数 。 显 然 我 们 需要 做 的 第 一 件 事 
征 确 定 k 的 值 。 


(gdb) print k 
$4 - 584 


可 以 看 出 ， 代 码 规 定 y 只 能 有 10 个 元 系 ， 因 此 k 的 值 实际 上 远 远 超过 了 这 一 范围 。 我 们 现在 必 
须 跟 躁 原因 。 

首先， 硝 定 段 错误 发 生 时 这 个 重要 循环 和 友 代 在 第 49 行 。 

(gdb) print num y 

$5 = 1 


ERG X E SB RIERA IRI ELLA S AT ER scoot. over() 时 发 生 了 段 错 误 。 换 言 之 ， 并 
不 是 前 儿 次 调用 scoot_over() 时 第 23 行 工作 得 很 好 而 在 以 后 调用 时 失败 了 。 这 行 代码 仍然 有 一 些 
根本 性 的 错误 。 由 于 只 剩 下 唯一 的 候选 语句 

















k++ 


C SL Bj t tor IK — 11 BECA RAO. KE Ta) ei ee HE. Fl, EE, 3X4] 
意识 到 原来 这 里 应 该 是 k- -。 

修复 这 行 代 码 并 再 次 重新 编译 运行 程序 。 

$ insert sort 12 5 


5 
12 


现在 已 经 有 了 进步 ! 但 是 该 程序 对 于 较 大 的 数据 集 是 否 运行 正确 呢 ? LEAN F o 


$ insert sort 12 5 19 22 6 1 
1 
5 
6 
12 
0 
0 


现在 已 经 看 到 了 成 功 的 曙光。 大 多 数 数 组 被 正确 地 排序 。 该 列表 中 的 第 一 个 没有 正确 排序 的 
数字 是 19， 因 此 在 第 36 行 设置 一 个 断 点 ， 这 次 采用 条 件 new_y == 19。?” 
(gdb) b 36 


Breakpoint 3 at 0x804840d: file ins.c, line 36. 
(gdb) cond 3 new y--19 
































C) 从 这 时 起 使 用 命令 的 常用 缩写 。 比 如 ，b 表 示 break，i b 表 示 info break, condxEzscondition, r#zKrun, n 
表示 next，s 表 示 step，c 表 示 continue，p 表 示 print，bt 表 示 backtrace。 





30 € 13k 预备 知识 


然后 在 GDB 中 运行 程序 (一 定 要 使 用 相同 的 参数 ，12 5 19 2261). MAJA, HOA 





到 目前 为 止 数 组 y 已 经 被 正确 地 排序 : 


31 y[0] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
*» 36 for (j = 0; j < num y; j++) { 
37 if (new y < y[j]) 1 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new y 
40 scoot over(j); 
41 ylj] = new y; 
42 return; 
43 } 
File: ins.c Procedure: insert Line: 36 pc: 0x8048564 


Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 19 22 6 1 


Breakpoint 2, insert (new y=19) at ins.c:36 
(gdb) p y 
$1 = {55 12, 0, 0, 0, 0, 0, 0, O, 0j 
(gdb) 


到 目前 为 目 , HWE. 现在 让 我 们 尝试 确定 程序 如 何 处 理 19。 我 们 仍然 一 次 一 行 代码 进行 
调试 。 注意， 因为 19 既 不 小 于 5， 也 不 小 于 12， 所 以 我 们 没有 期 望 第 37 行 的 if 语 句 中 的 条 件 成 立 。 








当 遇 到 n 儿 次 以 后 ， 我 们 发 现 目 己 位 于 第 45 行 上 : 


35 // element that new y is less than 
* 36 for (j = 0; j < num y; j++) { 
37 if (new y « y[j]) { 
38 // shift y[j], ylj+1],... rightward 
39 // before inserting new y 
40 scoot_over(j); 
41 y[j] = new y; 
42 return; 
43 } 
44 } 
» 45 } 
46 
47 void process data() 


File: ins.c Procedure: insert Line: 45 pc: 0x80485c4 
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(gdb) n 
(gdb) n 
(gdb) n 
(gdb) n 
(gdb) n 
(gdb) 


我 们 在 第 45 行 上 ,打算 退出 循环 ， 根 本 没有 对 19 做 任何 事情 ! 进一步 检查 结束 表明 ， 我 们 的 
代码 没 有 禾 访 一 个 重要 情况 ， 也 就 是 new_y 大 于 我 们 目前 为 止 处 理 的 元 到 的 情况 ， 第 34 行 和 第 35 
行 的 注释 还 揭露 了 一 个 玩 漏 : 


// need to insert just before the first y 
// element that new y is less than 


为 了 处 理 这 种 情况 ， 在 第 44 行 后 面 诺 加 如 下 代码 ; 


// one more case: new y » all existing y elements 


y[num y] = new y; 
然后 重新 编译 并 再 次 运行 程序 : 


$ insert sort 12 5 19226 1 


























19 
22 


这 是 正人 确 的 输出 ， 接 下 来 的 测试 也 给 出 了 正确 的 结 
1.7.2 同样 的 会 话 在 DDD 中 的 情况 

本 节 介 绍 上 面 的 GDB 会 话 在 DDD 中 是 什么 情况 。 当 然 不 需要 重复 所 有 步骤 , 只 要 关注 与 GDB 
不 同 的 内 容 即 可 。 

DDD 的 启动 与 GDB 相 似 。 用 GCC 编 译 源 代 人 码 ， 使 用 -g 选 项 ， 然 后 键入 

$ ddd insert sort 
从 而 调用 DDD。 在 GDB 中 ， 通 过 run 命 令 开 始 程 序 的 执行 ， 如 果 有 命令 行 参 数 的 话 ， 束 要 加 上 命 
令 行 参 数 。 在 DDD 中 ， 早 击 Progr am 一 Run， 然 后 将 看 到 图 1-8 所 示 的 屏 舌 。 

这 时 弹出 了 人 Run 窗口 ， 列 出 了 已经 使 用 过 的 命令 行 参数 。 这 里 以 前 还 没有 参数 集 ， 如 果 有 ， 
可 以 通过 单 击 其 中 任何 一 个 来 做 出 选择 ， 也 可 以 按 这 里 所 示 键 入 一 组 新 参数 。 然 后 里 击 Run 按 
FA 
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在 GDB 调 试 会 话 中 ， 我 们 在 调试 器 中 运行 了 一 会 儿 程序 ， 然 后 用 Ctrli+C 组 合 键 挂 起 它 ， 以 便 
研究 一 个 明显 的 无 限 循环 。 在 DDD 中 ， 我 们 则 通过 在 命令 工具 中 单 击 Interrupt 来 挂 起 程序 。DDD 
屏幕 现在 如 网 1-9 所 示 。 因 为 DDD 起 GDB 前 端的 作用 , 所 以 这 个 鼠标 单 击 在 GDB 中 被 翻译 为 Ctrl+C 
操作 ， 从 控制 台中 可 以 看 到 这 一 点 。 
上 面 的 GDB 会 话 中 的 下 一 步 是 检查 变量 num_y。 如 前 面 1.5 节 中 所 示 ， 在 DDD 中 ， 通过 在 源 窗 
口中 num_y 的 任意 实例 上 移动 鼠标 来 检查 该 变量 。 


DDD: /ho code/ins.c 





61 
62 int main(int argc, char ** argv) 
63 { get args(argc,argv); 

process data(); 

print, results(); 


'HO — DDD:RunProgram | OX; 





Copyright © 1999-2001 Universität Passau, Germany. 
Copyright © 2001 Universität des Saarlandes, Germany. 
Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread db library "/lib/libthread db.so.1". 
(gdb) 








图 1-8 ”DDD 的 Run 命 令 


19 
20 void scoot over(int jj) 
21 [( dnt k; 


23 for (k = num y-1; k > jj; k++) 
24 ylk] = v[k-1]; 
25 ) 


26 
27 void insert(int new y) 
int 3; 





Tf (num y = 0) { // y empty so far, easy case 


} 
// need to insert just before the first y 
// element that new y is less than 
for (j = 10; 3 < ae j++) { 
if (new y « y[j 


// shift ep yj, .. rightward 
// before inserting n ex y 

scoot over(j); 

y[3] = new y; 

return; 





Program received signal SIGINT, Interrupt. 
insert (new y-2) at ins.c:36 

nn /home/p/code/ins.c:36:721:beg:0x8048451 
(gdb) 








图 1-9 中 断后 的 屏幕 
也 可 以 用 这 种 方式 检查 整个 数组 。 例 如 ， 在 GDB 会 话 中 的 某 一 个 位 置 ， 输 出 整个 数组 y。 在 
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DDDH!, 只 要 将 鼠标 指针 移 到 源 窗口 中 y 的 任意 实例 上 即 可 。 如 果 在 第 30 行 上 的 表达 式 y[j] 中 的 y 
上 移动 光标 ， 屏 幕 会 如 图 1-10 所 示 。 这 一 行 附近 会 出 现 一 个 值 提示 框 ， 显 示 y 的 内 容 。 

在 GDB 会 话 中 的 下 一 个 动作 是 在 第 30 行 设置 一 个 断 点 。 虽 然 我 们 已 经 解释 了 如 何在 DDD 中 
设置 断 点 ， 但 是 如 果 像 本 例 中 这 样 需要 在 断 点 上 放置 条 件 ， 访 怎么 办 呢 ? 可 以 通过 右 击 断 点 行 中 
的 停止 标记 ， 然 后 选择 Properties 来 完成 这 件 事 。 这 时 会 出 弹出 一 个 窗口 ， 如 图 1-11 所 示 。 然 后 键 


入 条 件 : num y==1。 








if {num y = 0) { // y empty so far, easy case 
yl0] = new y; 
return; 


// need to insert just before the first y 


if (new y « y[31) { 
Jf shift y[j3]; ru rightward 


// before inserting n 
scoot "ih 


void process data() 
{ 


for (num y = 0; num y < num inputs; num_y++) 
// insert new y in the proper place 
// among y[0] y [num y-1] 
; insert (x[num y]); 


54 
55 void print results() 








图 1-10 ROO 


20 void scoot over(int 33) 
Zl 4 dnt k 
22 


for (k = num y-1; k > jj; k++) 
yik] = y[k-1]; 


void insert (int new y) 
C “nt j: 
29 


if (num_y = 0) { // y empty so far, easy case | 
y[0] = new_y; 
return; 


} 

// need to insert just before the first y 
// element that new y is less than 

for (J = Os) j < mm" j++) 


if (new y « y '8o DDD: Properties: Bre int 1 ox 


{ 
// shift ya, yl3*1], 
// before inserting ne 
scoot over(j); 
y[j] = new y; 
return; 


for (num y = 0; num y < num_ 
// insert new y in the pr 
// among y[0] E 


Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host egg db library "/lib/libthread db.so.1". 
(gdb) break ins. 

Breakpoint 1 at 029040484: file ins.c, line 30. 

(gdb) 











图 1-11 在 断 点 上 施加 一 个 条 件 
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然后 ， 为 了 重新 运行 程序 ， 在 命令 工具 中 单 击 Run 按 钮 。 由 于 GDB 的 run 命 令 没 有 参数 ， 
此 这 个 按钮 用 此 前 提供 的 最 后 一 组 参数 运行 程序 。 

在 DDD 中 ， 与 GDB 的 n 和 s 命 令 对 应 的 是 命令 工具 中 的 Next 和 Step 按 钮 。 对 应 于 GDB 中 的 c 命 
令 的 是 Cont 按 钮 。 

本 节 的 概述 足够 用 DDD 开 始 调 试 了 。 在 以 后 的 各 章 中 将 探索 DDD 的 一 些 蜗 级 选项 ， 比 如 非 
第 有 用 的 可 视 化 显示 复 林 数据 结构 (如 链表 和 二 又 树 〉 的 功能 。 


1.7.3 ”Eclipse 中 的 会 话 


现在 让 我 们 看 一 下 上 面 的 GDB 会 话 在 Eclipse 中 是 什么 情况 。 与 在 DDD 中 指出 的 一 样 ， 不 需 
要 重复 所 有 步骤 ， 我 们 百 接 将 重点 放 在 不 同 于 GDB 的 内 容 上 。 

注意 ，Eclipse 会 相当 讲究 。 虽 然 它 提供 了 很 多 方式 完成 菜 种 任务 ， 但 是 如 果 没 有 严格 遵循 必 
需 的 步骤 ， 你 可 能 会 发 现 除 了 重 局 部 分 调试 过 程 忆 外， 根本 没有 百 观 的 解决 方案 。 

这 里 我 们 假设 已 经 创建 了 C/C++ 项 目 。” 

当 第 一 次 运行 或 调试 程序 时 , 需要 运行 和 调试 配置 文件 .这 些 操作 指定 可 执行 文件 的 名 称 ( 以 
及 它 属 于 什么 项 目 )、 其 命令 行 参数 《如 条 有 的 话 )、 其 特殊 shell 变 量 环 境 《〈 如 果 有 的 话 )、 上 所 选 
择 的 调试 器 ， 等 等 。run 配 置 文 件 用 来 在 调试 器 之 外 运行 程序 ， 而 debue 配 置 文 件 用 来 在 调试 内 运 
行程 序 。 一 定 要 按 这 个 顺序 创建 两 个 配置 文件 ， 如 下 所 示 。 

(1) 选择 Run — Open Run Dialog. 

(2) iti C/C Local Applications 并 选择 New。 

(3) 选择 Main 选 项 卡 ， 并 填写 运行 配置 文件 、 项 目 及 可 执行 文件 名 〈Eclipse 可 能 会 提供 一 些 
提示 )， 如 果 有 终端 WO， 选 中 Connect process input and ouput to a terminal 框 。 

(4) 如 果 有 命令 行 参 数 或 特殊 环境 变量 ,， 单 击 Areuments 或 Environment 选 项 卡 ， 并 填写 所 需 设 


BH 





















































B 





(5) i&4#Debuggerit mF LA £x EH A EP as. HPA PRY EAS m eH — Ri, THE 
RZE, ARV ies, SRYTAEGDB. 

(6) 单 击 Apply《〈 如 末 看 到 这 样 的 要 求 ) 和 Close 按 钮 来 完成 运行 配置 文件 的 创建 。 

(7) 通过 选择 Run 一 Open Debug Dialog 来 创建 调试 配置 文件 。Eclipse 可 能 会 重用 你 的 运行 配置 
文件 中 提供 的 信息 ， 如 图 1-12 所 示 ; 如 采 你 愿意 ， 也 可 以 修改 它 。 再 次 单 击 Apply《〈 如 末 要 求 了 ) 
和 Close 按 钮 以 完成 调试 配置 文件 的 创建 。 

可 以 创建 几 个 运行 /调试 配置 文件 ， 通 第 是 用 不 同 的 命令 行 参数 集 。 

为 了 局 动 调试 会 话 ， 必 须 通 过 选择 Window 一 Open Perspective 一 Debug 来 移 到 Debug 透 视图 
中 。〈 有 各 种 各 样 的 快捷 方式 ， 留 待 读者 去 发 现 。) 
当初 次 实际 执行 运行 或 调试 动作 时 ， 同 样 要 通过 Run 一 Open Run Dialog 或 Run 一 Open Debug 

















C 由 于 本 书 关 于 调试 ， 而 不 关于 项 目 管 理 ， 因 此 这 里 不 打算 过 多 地 介绍 如 何在 Eclipse 中 创建 和 构建 项 目 。 然 而 ， 这 
里 可 以 扼要 说 明 一 下 创建 项 目的 步骤 : 选择 File 一 New 一 Project， 选 择 C (或 C++) 项 目 ， 填 写 一 个 项 目 名 ， 选 择 
Executable > Finish. 日 动 创建 一 个 makefile 文 件 。 通 过 选择 Project 一 Build Project 来 构建 项 目 〈 即 编译 与 连接 )。 
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Dialog 〈 根 据 情 况 而 定 )， 以 指出 使 用 哪个 配置 文件 。 然 和 而， 从 那 以 后 只 要 选择 Run 一 Run 或 Run 
一 Debug， 都 可 以 再 次 运行 上 一 个 调试 配置 文件 。 


ebug 
Create, manage, and run configurations BS 


D @ *| Ge + 








Name: |insert_sort 














in > 9 Arguments | PS Environment | $* Debugger] 5 Source | 上 Common | 





[C/C++ Attach to Local 





YV [E]C/C++ Local Applicatic || | Project: 
C/C++ Postmortem de || | C/C++ Application: 
© Jython tun Search Project... 
Z5 Jython unittest 
Vv 
£z Python Run Connect process input output to a terminal. 
Z testpy try.py 


Z5 Python unittest 




















— ái [ Amy j| Ree | 
Filter matched 9 of 9 items 
á NM 











1-12 Debug/li Eo iE TE 


事实 上 ， 在 本 调试 例子 中 ， 有 一 个 局 动 调 试 运行 的 快捷 方式 ， 即 单 击 Navigate 下 的 Debug 图 
标 〈 见 图 1-13)。 不 过 要 小 心 ， 每 当局 动 一 个 新 调试 运行 时 ， 都 需要 单 击 一 个 红色 的 Terminate 方 
框 来 退出 正在 运行 的 那个 调试 。 一 个 这 样 的 方 框 在 Debug 视 网 的 工具 栏 中 ， 另 一 个 在 控制 台 视 网 
中 。Debug 视 图 还 有 一 个 双 X 图 标 ，Remove All Terminated Launches. 




















ebug - insert_sort/ins.c - Eclipse Platform BEE 
Eile Edit Refactor Navigate Search Project Run Window Help 
| r37 |B | He DO- Q- | 7 | Bir YH © Or Or cm " 
35» Debug "S 7 B || 9e Breakpoints |69- Variables 23 ^. Hi? Registers | TB 




















YV && gdb/mi (12/15/07 3:47 PM) (Suspended) 
"v a? Thread [0] (Suspended) 


argc 4 
> argv Oxbfb97444 





o] 
*eé(»:mes:ecss|iexz-7 a- GODEL N 
7 [t]insert sort Deb| Resume! Local Application] | Name Value 




















Cc—— 8 |") 
dioc (12/15/07 3:47 PM) 自 
C) | 
= B || EE Outline 3 \ cUm 
for (i = 0; i « num inputs; i++) 3 . = 
printf("%d\n",y[i]); 
€ x.:int[] 
9 y:i 
int main(int argc, char ** argv) Yn 
* ( get_args(argc,argv); € num. inputs : int 
1 process. data(); 9 num y: int 
print. results(); RSS 


9 get args(int, char**) : void 
9 scoot over(int) : void 




















& Console 33 @ Tasks | 区 Problems| G Memory | B x |i ae r4 tB rg su 
insert sort Debug [C/C++ Local Application] /workspace/insert sort/Debug/insert. sort (12/15/07 3:47 PM) 
then: then/endif not found. | 




















| o Wiitable Smart Inset 63:1 | 
图 1-13 ”调试 运行 的 开始 


图 1-13 显 示 了 局 动 调试 之 后 出 现 的 屏 贤 。 虽 然 人 们 可 以 在 Eclipse 调 试 对 话 框 中 设置 局 动 行 ， 
但 是 通常 默认 将 一 PEAR A FE。 在 图 1-13 中 ， 可 以 从 下 面 的 代码 行 的 左 
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XJ "p ESSE AS EA BX wa: 


{ get_args(argc,argv); 


这 一 行 也 是 突出 显示 的 ， 因 为 它 是 要 执行 的 代码 行 。 通 过 在 Debug 视 图 工具 栏 中 单 击 Resume 
图 标 来 前 进 并 执行 , 这 个 工具 栏 在 窗口 中 弹出 的 一 个 框 上面 , 因为 你 将 鼠标 指针 移 到 了 该 图 标 处 。 

在 示例 GDB 会 话 中 ,程序 的 第 一 个 版 本 有 一 个 无 限 循环 , 程序 被 挂 起 。 这 里 当然 会 看 到 同样 
的 现象 ， 控 制 台 视图 中 没有 输出 。 你 需要 关闭 这 个 程序 。 然 而 ， 你 不 想 通 过 单 击 那 个 红色 的 
Terminate 方 框 来 做 到 这 一 点 ， 因 为 这 也 会 天 财 底层 GDB 会 话 。 你 要 留 在 GDB 中 ， 以 便 碍 看 你 位 
于 代码 中 的 何 处 ( 即 无 限 循环 的 位 置 ) 分 析 变 量 的 值 ， 等 等 。 因 此 ， 不 要 选择 Terminate 操 作 ， 而 
要 选择 Suspend， 单 击 Debug 视 图 工具 栏 中 的 Resume 右 边 的 图 标 。( 在 Eclipse 文献 中 ， 这 个 按钮 有 
时 被 称 为 Paquse， 因 为 它 的 符号 类 似 于 媒体 播放 占 中 的 暂 集 操作。) 

当 单 击 Suspend 后 , BEA n E] -14 Tz « 从 图 中 可 以 看 到 在 该 操作 之 采 , Eclipse 打算 执行 以 下 行 。 



































for (j = 0; j < nun y; j++) { 


Eile Edit Refactor Pr Search Project Run Window Help 
| ta D | %- O- Q- |e |g 








$ 中 ia, 2 oc .e Pe 
v 回 insert_sort Debug [C/C++ Local Application] 
V GP gdb/mi (12/15/07 3:47 PM) (Suspended) 
"v a? Thread [0] (Suspended: Signal 'SIGINT' received. Descript 
































) v 
// need to rt just be fore the first y 1 le Be, 
// element iat new less than 9 x:int[] 
for (j = = 0: j« nun y: Pm € y: ing 
if (new_y < y[j]) | 
// € - Yi], its: *1],... rightward € num inputs : int 
Lee serting n ew_y | € num y: int 
d et pasta $ i 
y[j] » new y; 9 get args(int, char^*) : void 
return; 9 scoot over(int) : void 
一 








(© Console 23 £i Tasks | [*: Problems | @ Memory. a ae - re E rie =o) 
insert. sort Debug [C/C++ Local Application] /workspace/insert_sort/Debug/insert_sort (12/15/07 3:47 PM) | 
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en MAS 
现 该 值 为 0)， 等 等 。 

再 次 回顾 我 们 前 面 的 GDB 会 话 。 当 修复 了 几 个 程序 错误 后 ， 程 序 出 现 了 一 个 段 错误 。 网 1-15 
显示 了 那 一 刻 的 Eclipse 屏幕 。 

发 生 的 事情 是 当时 我 们 单 击 了 Resume 按 钮 ， 因 此 程序 继续 运行 ， 突 然 因 为 段 错 误 而 在 如 下 
这 行 代码 处 停止 


ylk] = y[k-1]; 
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奇怪 的 是 ， 从 图 1-15 中 还 可 以 看 出 ，Eclipse 没 有 在 Problems 选 项 卡 中 指出 这 个 问题 ,而 是 在 Debug 
选项 卡 中 显示 如 下 错误 消 忆 。 


(Suspended'SIGSEGV' received. Description: Segmentation fault.) 













Debu nse [LET - 
Eile "m rum em T€ Project Run Window Help 


@ | #- O- Q7 | 7 | 8 Ge € Oe Oe t: Debug) 











i2 Debug $t : | “ol Breakpoints | Variables % Bit Registers) 
€» i> a A @ .& i P» B 

= [€ ]insert. sort Debug [C/C++ Local Application] 加 || Name Value 

| "Y Ge gdb/mi (12/15/07 4:40 PM) (Suspended) o5 0 










"v of Thread [0] (Suspended: Signal 'SIGSEGV' received. Des 

















= num y; k > jj; k++) 
i hy y[k-1]; 


void insert(int new y) 
( int j; 





9 get args(int, char") : void 
9 scoot over(int) : void 









if (m raga ie ( // y empty so far, easy case 










insert. sort. v ICE Local Application] /workspace/insert_sort/Debug/insert_sort (12/15/07 4:40 PM) 
fthen: then/endif not found. 














Kli-15 BIRR 
在 这 个 选项 卡 中 可 以 看 到 错误 发 生 在 从 insert() 中 调用 的 函数 scoot_over() 中 。 像 在 GDB 








示例 中 那样 ， 你 同样 可 以 查询 变量 的 值 ， 比 如 发 现 K=544 超 出 了 范围 。 

在 GDB 示 例 中 还 设置 了 条 件 断 点 。 在 Eclipse 中 通过 在 所 需 行 的 左边 空中 双击 来 设置 灯 点 。 要 
使 该 断 点 为 条 件 断 点 ， 那 么 右 击 那 一 行 的 断 点 符号 ， 并 选择 Breakpoint Properties... 一 New 一 
Common， 然 后 在 对 话 框 中 填写 条 件 。 该 对 话 框 如 图 1-16 所 示 。 


v | Properties for C/C-— breakpoint 


Common 








Actions Type: C/C++ line breakpoint 


Hi. jwoapucuer son 


Filtering Line number. 30 
Enabled 


Condition:  |umy--d | 
aa ) 








图 1-16 ”使 断 点 成 为 条 件 断 点 
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我 们 还 介绍 过 ， 在 GDB 会 话 中 ， 偶 尔 会 在 GDB 外 面 〈 在 单独 的 终端 窗口 中 ) 执行 程序 。 在 
Eclipse 中 通过 选择 Run 一 Run 也 可 以 轻松 地 做 到 这 一 点 。 与 惯 第 一 样 ， 结 果 将 显示 在 控制 台 视 图 
uu 


1.8 ”启动 文件 的 使 用 


正如 前 面 捉 到 的 ， 在 重新 纺 详 代码 时 ， 最 好 不 要 退出 GDB。 这 样 ， 你 的 断 点 和 建立 的 其 他 各 
种 动作 都 会 你 留 《〈 比 如 第 3 章 将 介绍 的 display 命 令 )。 要 是 退出 GDB， 台 不 得 不 再 次 重复 键入 所 
有 这 些 内 容 。 

然而 ， 在 完成 调试 前 可 能 需要 退出 GDB。 如 果 你 要 离开 一 段 时 间 基 至 离开 一 天 ,而且 不 能 你 
持 登 录 在 计算 机 中 ， 则 需要 退出 GDB。 为 了 不 丢失 它们 ， 可 以 将 断 点 和 设置 的 其 他 命令 放 在 一 个 
GDB 月 动 文件 中 ， 然 后 每 次 月 动 GDB 时 会 目 动 加 载 它 们 。 

GDB 的 司 动 文件 默认 名 为 .8dpzziz。 可 以 将 一 个 文件 放 在 主 目录 中 用 于 一 般 用 途 ， 万 一 个 文 
件 放 在 特定 项 目 专 用 的 目录 中 。 例 如 ,将 设置 断 点 的 命令 放 在 后 一 个 目录 的 局 动 文件 中 。 在 主 目 
录 的 .gdpimitf 文 件 中 ， 还 可 以 存储 你 开发 的 一 些 通用 的 宏 《〈 第 2 章 将 会 介绍 )。 

GDB 在 加 载 可 执行 文件 乙 前 会 谈 取 主 目录 中 的 局 动 文件 。 因 此 ， 要 是 在 主 目录 的 .gd2ozzz 文 
PAS, ECM: 


break g 










































































表示 要 在 函数 g() 上 中 断 ， 那 么 GDB 总 是 会 在 启动 时 抱怨 它 不 知道 该 函数 。 然 而 ， 在 本 地 项 目 目 
录 的 局 动 文件 中 可 以 有 这 行 代 码 ， 因 为 本 地 局 动 文件 是 在 加 载 了 可 执行 文件 〈 及 其 符号 表 ) 之 后 
读 取 的 。 注意 ，GDB 的 这 个 特性 暗示 了 最 好 不 要 将 编程 项 目 放 在 主 目录 中 ， 因 为 不 能 将 项 目 特有 
的 信息 放 在 .gdbinit 中 。 

在 调用 GDB 时 可 以 指定 启动 文件 。 例 如 ， 


$ gdb -command=z x 














表示 要 在 可 执行 文件 x 上 运行 GDB， 首 先 要 从 文件 z 中 读 取 命令 。 此 外 ， 因 为 DDD 只 是 GDB 的 一 
个 前 端 ， 所 以 调用 DDD 也 会 调用 GDB 的 局 动 文件 。 
最 后 ， 可 以 通过 选择 Edit 一 Preferences 来 以 各 种 各 样 的 方式 定制 DDD。 对 于 Eclipse， 选 择 


Windows- Preferences. 
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NOR 然而 ， 在 可 执行 文件 中 神奇 般 
地 加 入 调试 符号 后 ， 调 试问 呈现 了 可 以 逐 行 执行 源 代 码 的 错 党 ， 而 不 是 基于 逐个 被 编 
详 的 机 器 人 码 指令 执行 。 这 一 看 似 镜 单 的 事实 恰好 使 得 符 写 调试 如 在 调试 程序 中 非常 有 用 。 

如 果 调 试 器 能 做 的 仅仅 是 运行 程序 ， 那 么 对 我 们 来 说 没有 太 大 的 用 处 。 我 们 当然 也 能 做 同样 
的 事情 ， 而 且 还 更 有 效率 。 调 试 器 的 好 处 在 于 : 可 以 通知 它 暂 俘 程 序 的 执行 。 和 暂停 以 后 ， 调 试 需 
让 我 们 得 以 检 碍 变量 、 跟 踩 执 行路 径 等 。 


2.1 暂停 机 制 


有 3 种 方式 可 以 通知 GDB 和 暂停 程序 的 执行 。 

O 断 点 : 通知 GDB 在 程序 中 的 特定 位 置 暂停 执行 。 

O 监视 点 : 通知 GDB 当 特定 内 存 位置 ( 或 者 涉及 一 个 或 多 个 位 置 的 表达 式 〉 的 值 故 生变 化 
时 暂停 执行 。 

O 捕获 点 : 通知 GDB 当 特定 事件 发 生 时 暂停 执行 。 

容易 混 消 的 是 〈 一 开始 ), 在 GDB 文 档 中 将 这 3 个 机 制 都 称 为 断 点 。 这 可 能 是 因为 它们 的 很 多 

属性 和 命令 都 相同 。 例 如 ， 在 帮助 文档 中 可 以 看 到 ，GDB 关 于 删除 断 点 的 delete 命 令 : 
(gdb) help delete 
Delete some breakpoints or auto-display expressions. 


Arguments are breakpoint numbers with spaces in between. 
To delete all breakpoints, give no argument. 












































然而 ， 有 经 验 的 GDB 用 户 知道 帮助 文档 在 这 里 的 真正 意思 是 delete 命 令 可 以 删除 所 有 断 点 、 
监视 点 和 捕获 点 ! 


2.2 EEA this 


Writ BEEP HP ZED: 在 程序 中 的 特定 “人 位置” 设置 断 点 ， 当 到 达 那 一 点 时 ， 调 试 器 会 暂 
停 程序 的 执行 《在 GDB 这 样 的 基于 文本 的 调试 器 的 情况 下 ， 会 出 现 命 令 行 提示 符 )。 
GDB 中 关于 “位 置 ”的 含义 是 非 冲 灵活 的 ， 它 可 以 指 各 种 源 代 码 行 、 代 码 地 址 、 源 代码 文件 
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中 的 行 写 或 者 函数 的 入 口 等 。 
下 面 是 一 个 调试 会 话 片 段 ， 说 明 当 GDB 在 一 行 代 码 上 中 断 时 发 生 的 事情 。 在 这 段 代码 中 ， 列 
出 了 部 分 源 代码 ， 在 程序 的 第 35 行 放置 了 一 个 断 点 ， 然 后 运行 程序 。GDB 到 达 该 断 点 并 暂停。 

















(gdb) list 

30 

31 /* Get the size of file in bytes */ 

32 if ((fd = open(c.filename, O RDONLY)) == -1) 
33 (void) die(1, "Can't open file."); 
34 (void) stat(c.filename, &fstat); 

35 c.filesize = fstat.st size; 

36 


(gdb) break 35 

Breakpoint 1 at 0x8048ff3: file bed.c, line 35. 

(gdb) run 

Starting program: binary editor/bed 

Breakpoint 1, main (argc-1, argv=Oxbfa3e1f4) at bed.c:35 

35 c.filesize - fstat.st size; 

(gdb) 

让 我 们 解释 一 下 这 里 发 生 了 什么 事 : GDB 从 第 30 行 执行 到 第 34 行 ， 但 是 第 35 行 还 没有 执行 。 
这 可 能 有 点 让 人 迷惑 ， 因 为 很 多 人 以 为 GDB 显 示 的 是 最 后 执行 的 代码 行 ， 而 事实 上 , 它 显 示 的 是 
将 要 执行 的 代码 行 。 在 本 例 中 ，GDB 告 诉 我 们 第 35 行 是 将 要 执行 的 下 一 行 源 代码 。 当 GDB 的 执 
行 到 达 第 3$ 行 的 断 点 时 ， 可 以 认为 GDB 在 源 代 码 的 第 34 行 和 第 35$ 行 之 间 等 待 。 

然而 你 知道 , GDB 的 工作 针对 的 是 机 器 语言 指令 ， 而 不 是 源 代 码 行 ， 一 行 代码 可 能 对 应 于 数 
行 机 噩 语言 。GDB 之 所 以 可 以 使 用 源 代 码 行 ， 是 因为 可 执行 文件 中 包括 了 额外 的 信息 。 昌 然 这 个 
事实 暂时 似乎 还 不 太 重 要 ， 但 是 在 本 章 讨论 单 步 调试 程序 时 会 有 一 定 的 涉及 。 


2.3 ”跟踪 断 点 

程序 员 创建 的 每 个 断 点 (包括 断 点 、 监 视点 和 捕获 点 〉 都 被 标识 为 从 1 开始 的 唯一 整数 标识 
符 。 这 个 标识 符 用 来 执行 该 断 点 上 的 各 种 操作 。 调 试 右 还 包括 一 种 列 出 所 有 上 断 点 及 其 属性 的 方式 。 
2.3.1 GDB 中 的 断 点 列表 

当 创 建 断 点 时 ，GBD 会 告知 你 分 配给 该 断 点 的 编写。 例如， 本 例 中 设置 的 断 点 : 

(gdb) break main 

Breakpoint 2 at 0x8048824: file efh.c, line 16. 
BLOT ACH S E20 WARS 2T Ace HAS HUSR eT A, a MEH info breakpoints 命 令 
来 所 示 。 

(gdb) info breakpoints 

Num Type Disp Enb Address What 









































2.3 IREA 4M 


breakpoint keep y 0x08048846 in Initialize Game at efh.c:26 


breakpoint keep y 0x08048824 in main at efh.c:16 
breakpoint already hit 1 time 
3 hw watchpoint keep y efh. level 


catch fork keep y 


我 们 将 看 到 这 些 标 识 符 用 来 执行 断 点 上 的 各 种 各 样 的 操作 。 为 了 具体 说 明 ， 来 看 一 个 简单 的 pm 





示例 。 
上 一 节 中 介绍 了 delete 人 命令。 通过 使 用 delete 命 令 以 及 断 点 标识 符 ， 可 以 删除 断 点 1、 监 视 
点 3 及 捕获 点 4 


(gdb) delete 13 4 


下 面 儿 市 将 介绍 断 点 标识 人 符 的 其 他 用 途 
2.3.2 ”DDD 中 的 断 点 列表 


DDD 用 户主 要 使 用 点 选 式 界面 执行 断 点 管理 操作 ， 因 此 断 点 标识 符 对 于 DDD 用 刀 不 如 对 
GDB 用 户 那 么 重要 。 选 择 Source 一 Breakpoints 会 弹出 Breakpoints and Watchpoints 窗 口 ， 其 中 列 出 


了 所 有 上 断 点 ， 如 图 2-1 所 示 。 
-一 一 


y[k] = y[k-1]; 





void insert(int new yJ[ 
P dnt 15 


if (num y = 0) £ // y empty so far, easy case 
y[0] = new y; 
return; 


// need to insert just before the first y 
= element that new y is less than 


f 

yp. . rightward 
// before dnsarting Ww oy 

scoot over(j); 

y[j] = new y; 

return; 


(J opp: Breakpoints and Watchpoints 


ui Enb iud What 


PP ] 080484 zu S.C:4 
Tm y 000049402 T process. data at mm cie 
rd breakpoint already hit 1 time 


(gdb) run 12 
then: then/e 


Breakpoint 3 
(gdb) I 





图 2-1 在 DDD 中 查看 断 点 
然而 表面 介绍 过 ，DDD 人 允许 使 用 GBD 的 基于 命令 的 界面 及 其 提供 的 GUI。 在 有 些 情 部下 ， 
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GDB 提 供 了 不 能 通过 DDD GUI 使 用 的 断 点 操作 ， 但 是 DDD 用 户 能 够 通过 DDD 控 制 台 访问 那些 特 
殊 的 GDB 操 作 。 在 这 些 情况 下 ， 汤 点 标识 答对 DDD 用 户 仍 然 是 很 有 用 的 。 

注意 ， 如 果 愿 意 ， 可 以 让 这 个 Breakpoints and Watchpoints 窗 口 始 终 打 开 ， 只 要 将 它 拖 放 到 屏 
攻 的 方便 部 分 即 可 。 
2.3.8 ”Eclipse 中 的 断 点 列表 


Debug 透 视图 中 包括 Breakpoints 视 图 。 例 如 ， 在 图 2-2 中 可 以 看 到 文件 ins.c 的 第 30 行 和 第 52 行 
目前 有 两 个 断后 。 

















D | %- DO- Q |e | Sir Gr 





= B 9o Breakpoints 23 \ Variables | >o 
eZl gY X d$ 60 OB’ 
e /workspace/insert_sort/ins.c [line: 30] 


























(EE Outline N =o] 





for (num_y = 0; num_y < num_inputs; num_y++) A ae € * 


// insert new y in the proper place @ x: int] 


€ y:ing 
€ num inputs : int 





void print results() € num y : int 
[ int i; 9 get args(int, char"*) : void 


nr (i = 0 i < mm innuts* i 9 scoot over(int) : void 





(E Console 1^ IZ Tasks | i Problems | ^E-rj-B 
No consoles to display at this time. 


^ lema 


























" Writable Smart Insert 30:51 | 


图 2-2 ”在 Eclipse 中 查看 断 点 
可 以 右 击 任 意 断 点 的 入 口 来 检查 或 修改 其 属性 。 另 外 ,双击 入 口 将 导致 源 文件 窗口 的 焦点 转 
Te SIUS Ex E. 
2.4 iE S 
VV LHOB Se Y ARP ELIT ESL 
2.4.1 在 GDB 中 设置 断 点 


表面 已 经 介绍 过 ，GDB 给 人 一 种 逐 行 运行 源 代 码 的 销 觉 。 使 用 GDB 时 ， 需 要 指示 在 何 处 暂 
停 执 行 ， 以 便 使 用 GDB 的 命令 行 提 示 符 执行 调试 活动 。 本 节 将 介绍 如 何 设 置 断 点 ， 并 通知 GDB 
在 源 代 码 的 何 处 停止。 

GDB 中 有 许多 指定 断 点 的 方式 ， 下 面 是 一 些 最 常见 的 方法 。 














2.4 设置 断 点 43 


€ break function 
FE ek X fFunction() A H1 ETATE) 处 设置 断 点 。 在 2.3.1 季 中 提供 过 这 种 示例 ， 
下 述 命令 在 main() 的 入 口 处 设置 断 点 : 


(gdb) break main 


€ break Line number 
在 当前 活动 源 代 码 文 件 的 Line_number 处 设置 断 点 。 对 于 多 个 文件 的 程序 ， 这 要 么 是 上 次 使 
用 1ist 命 令 查看 其 内 容 的 文件 ， 要 么 是 包含 main() 的 文件 。2.2 节 中 提供 过 这 种 情况 的 示例 。 
(gdb) break 35 
它 在 文件 pedc 中 的 第 3$ 行 处 设置 了 一 个 断 点 。 
€ break filename:Line number 


TE JS XB X fF fFilenamel] Line number Ab ix EE ES. UlWfilename^1E2 gj LfEHoen, M 
可 以 给 出 相对 路 径 名 或 者 完全 路 和 颂 名 来 帮助 GDB 查 找 该 文件 ， 例 如 : 


(gdb) break source/bed.c:35 




















€ break filename:function 
在 文件 fiLename 中 的 函数 function() 的 入 口 处 设置 断 点 。 香 和 载 函 数 或 者 使 用 同名 前 态 函 数 的 
程序 可 能 需要 使 用 这 种 形式 ， 例 如 : 


(gdb) break bed.c:parseArguments 
我 们 后 面 将 看 到 ， 当 设置 一 个 断 点 时 ， 该 断 点 的 有 效 性 会 持续 到 删除 、 荣 用 或 退出 GDB 时 。 


然而 , 临时 断 点 是 首次 到 达 后 了 驶 会 被 目 动 删除 的 断 点 。 临 时 断 点 使 用 tbreak 命 令 设 置 , 它 与 break 
采用 相同 类 型 的 参数 。 例 如 ，tbreak foo.c:16 在 文件 po.c 的 第 10 行 处 设置 临时 断 点 。 











其 他 break 人 参数 
break 命 令 还 有 一 些 别 的 参数 ， 也 许 很 少 用 到 。 
口 使 用 break +offset 或 break -ofFFset， 可 以 在 当前 选中 栈 帧 中 正在 执行 的 源 代 码 行 之 前 
或 之 后 offset 行 设置 断 点 。 
口 break *address 这 种 形式 可 用 来 在 虚拟 内 存 地 址 处 设置 断 点 。 这 对 于 程序 没有 调试 信息 
的 部 分 ( 比如 找 不 到 源 代码 时 ， 或 者 对 于 共享 库 ) 是 必需 的 。 


对 于 同名 函数 要 加 上 注释 。C++ 人 允许 重 载 函 数 ( 使 用 相同 的 名 称 定义 函数 )。 甚 至 在 C 语 言 中 
也 可 以 重 载 函 数 ， 只 要 使 用 static 限 定 符 声 明 带 文件 作用 域 的 函数 。 使 用 break function 会 在 所 
有 具有 相同 名 称 的 函数 上 设置 断 点 。 如 果 要 在 函数 的 某 个 特定 实例 上 设置 断 点 , 则 需要 没有 歧义 ， 
比如 在 break 命 令 中 给 出 源 代码 文件 中 的 行 号 。 

GDB 实 际 设置 断 点 的 位 置 可 能 与 你 请 求 将 断 点 放置 的 位 置 不 同 。 不 熟悉 GDB 的 开发 人 员 
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可 能 对 此 感到 不 安 ， 因 此 让 我 们 看 一 下 这 种 奇怪 现象 的 简短 示例 。 来 看 下 面 这 个 短程 序 ， 
testi.c: 


1 int main(void) 
» { 

3 int i; 

4 1 = 31 


6 return 0; 
7 } 


不 加 优化 地 编译 这 个 程序 ， 并 党 试 在 main() 的 入 口 处 设置 断 点 。 你 以 为 断 点 会 放 在 函数 的 上 
方 一 一 在 第 1 行 、 第 2 行 或 第 3 行 。 虽 然 人 们 第 向 猜测 断 点 会 在 这 些 位 置 ， 但 是 他 们 错 了 。 上 断 点 实 
际 上 在 第 4 行 。 














$ gcc -g3 -Wall -Wextra -o test1 testi.c 

$ gdb test1 

(gdb) break main 

Breakpoint 1 at Ox6: file testi.c, line 4. 


第 4 行 不 能 算是 main() 的 开头 行 ， WARE T TTARUE? 你 可 能 猜 到 ， 一 个 原因 是 这 一 行 是 
可 执行 代码 。 我 们 介绍 过 ，GDB 实 际 上 是 使 用 机 器 语言 指令 工作 的 ， 但 是 有 了 增强 的 符号 表 的 
厢 力 后 ，GDB 表 现 出 了 使 用 源 代 码 行 的 错觉 。 一 般 来 说 这 个 事实 不 太 重 要 ， 但 是 在 这 种 情况 下 
这 一 事实 却 变 得 很 重要 。 实 际 上 ， 声 明 i 确 实 会 生成 机 豆 码 ， 但 是 GDB 认 为 这 种 机 融 人 码 对 于 我 们 
的 调试 目的 来 说 没有 用 处 。" 因 此 ， 妆 要 求 GDB 在 main() 的 开头 中 断 时 ， 它 就 在 第 4 行 设置 了 一 


INO 

















其 他 断 点 类 型 

此 外 ， 还 有 一 些 break 风 格 的 命令 ， 本 书 不 打算 深入 介绍 ， 因 为 它们 的 专用 性 很 强 。 

hbreak 命 令 设 置 硬 件 辅助 断 点 。 这 是 可 以 在 内 存 中 设置 的 断 点 ， 不 需要 修改 该 内 存 位 置 的 
内 容 。 这 需要 硬件 支持 ， 主 要 用 于 EEPROM/ROM 调试 。 此 外 ， 还 有 一 个 设置 临时 硬件 辅助 断 
点 的 thbreak 命 令 。hbreak 和 thbreak 命 令 采 用 与 break 和 tbreak 相 同类 型 的 参数 ， 

rbreak 命 令 采 用 grep 风 格 的 正则 表达 式 ， 并 在 匹配 该 正则 表达 式 的 任何 函数 的 入 口 处 设置 
断 点 。 关 于 rbreak 要 知道 两 件 事 。 HA, 请 记 住 rbreak 使 用 grep 风 格 的 正则 表达 式 , 而 不 是 Perl 
风格 的 正则 表达 式 或 者 shell 风 格 的 文件 名 蔡 换 ( globbing )。 举 例 来 说 ， 这 意味 着 rbreak func* 
会 将 断 点 放 在 名 为 func 和 funcc() 的 函数 上 ， 而 不 会 放 在 function() 上 。 其 次 ， 在 rbreak 的 参 
数 前 面 或 后 面 有 一 个 隐 仿 的 .*， 因 此 ， 如 果 不 布 望 rbreak func 在 afunc() 上 设置 断 点 ， 应 当 使 
用 rbreak ^func. 


(D 可 以 通过 -Ss 选 项 查看 GCC 生成 的 机 器 码 。 
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当 打 开 优 化 来 编译 程序 时 ， 这 个 问题 可 能 变 得 更 糟 料 。 让 我 们 来 看 一 下 。 打 开 优 化 ， 重 新 编 
译 该 程序 。 

$ gcc -09 -g3 -Wall -Wextra -o test1 test1.c 

$ gdb test1 


(gdb) break main 
Breakpoint 1 at 0x3: file test1.c, line 6. 


我 们 要 求 在 main() 的 开头 放置 一 个 断 点 ， 但 是 GDB 在 main() 的 最 后 一 行 放置 了 一 个 断 点 。 
到 底 发 生 了 什么 事 ? 答案 与 前 面相 同 ， 只 是 GCC 扮演 了 一 个 更 主动 的 和 角色。 在 优化 打开 的 情况 
下 ，GCC 注 意 到 虽然 为 i 赋 了 予 了 一 个 值 ， 但 是 永远 用 不 到 这 个 值 。 因 此 ， 为 努力 生成 更 有 效 的 代 
人 码 ，GCC 就 把 第 3 行 和 第 4 行 代码 优化 掉 了 。GCC 永 远 不 会 生成 这 几 行 的 机 器 指令 。 因 此 ， 生 成 
机 器 指令 的 第 一 行 源 代 人 码 恰 好 是 main() 的 最 后 一 行 。 这 是 在 调试 完成 前 不 应 当 优 化 代码 的 原因 
cues 

















捕 3x 点 
C++ 程 序 员 或 许 会 想 了 解 设置 捕获 点 的 catch 命 令 。 捕 获 点 类 似 于 断 点 ， 但 是 能 够 通过 如 
抛 出 异常 、 捕 获 异 常 、 发 信号 通知 、 调 用 fork()、 加 载 和 得 载 库 等 很 多 事件 触发 。 
本 书 将 详细 介绍 断 点 和 监视 点 ， 而 让 读者 参阅 GDB 文 档 了 解 关 于 捕获 点 的 更 多 信息 。 








知道 所 有 这 坚 情 况 后 ， 如 宋 发 现 设置 断 点 后 没有 正好 在 你 预期 的 地 方 产 生 断 点 ， 你 现在 丈 知 
BENAT, AAA) PE. 

2 AREE 8. TR) TURNS EAS TN aS RET ATL. SIGDBIEH Z IST 
所 中断 一 行 源 代 码 时 ， 它 只 会 中 断 一 次 。 换 言 之 ， 当 它 到 达 该 行 代码 时 ， 如 于 恢复 执行 ， 会 忽略 
恰好 在 同一 行 上 的 其 他 断 点 。 事 实 上 ，GDB 知 道 是 哪个 断 点 “触发 ”了 程序 停止 执行 。 在 具有 多 
个 断 点 的 代码 行 上 ， 触 发 中 断 的 断 点 将 是 标识 符 编 号 最 小 的 断 点 。 


2.4.2 在 DDD 中 设置 断 点 


为 了 使 用 DDD 设 置 断 点 , 在 源 窗 口中 得 找 要 议 置 断 点 的 代码 行 。 将 光标 放 在 那 一 行 上 的 任意 
宇 折 处， 碳 击 ， 这 时 会 弹出 一 个 染 单 。 将 鼠标 同 下 拖 动 ， 直 到 突出 显示 Set Breakpoint 选 项 ， 然 后 
释放 鼠标 按键 。 这 时 应 当 在 议 置 断 点 的 代码 行 劳 边 看 到 一 个 红色 俘 止 记号 。 如 果 没 有 使 用 断 点 做 
任何 特别 的 事 ， 比 如 使 它 成 为 条 件 断 点 〈 将 在 2.10 节 讨论 )， 那 么 一 种 快捷 方式 是 直接 双击 这 行 
代码 。 

如 条 一 二 在 用 DDD， 你 可 能 会 注意 到 ， 当 在 一 行 代码 劳 边 按 下 鼠标 右键 时 ， 弹 出 沫 单 中 会 包 
含 选项 Set Temporary Breakpoint。 这 束 是 在 DDD 中 设置 临时 断 点 〈 当 首次 到 达 后 束 消 失 的 断 点 ) 



























































CD 实际 上 ,在 打开 优化 编译 可 执行 文件 时 ， 有 些 调试 器 真 的 会 阻 宕 。 GDB 是 可 以 调试 优化 代码 的 为 数 不 多 的 调试 器 
之 一 ， 但 是 正如 你 看 到 的 ， 结 果 会 有 问题 。 
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的 方法 ， 这 种 方法 调用 了 GDB 的 tbreak 命 令 。 

同样 ， 不 要 未 记 DDD 实 际 上 是 GDB 的 前 端 。 可 以 在 DDD 中 使 用 DDD 的 控制 台 窗 口 执行 任意 
GDB 风 格 的 中 断 命令 。 有 时 需要 这 种 办 法 ， 如 果 程 序 非常 大 或 者 是 多 文件 程序 那么 使 用 GDB 
语法 设置 断 点 会 很 方便 。 事 实 上 ， 之 所 以 有 时 有 必要 这 样 做， 是 因为 并 非 GDB 的 所 有 上 断 点 命令 都 
可 以 从 DDD 界 面 中 调用 。 


2.4.3 在 Eclipse 中 设置 断 点 


为 了 在 Eclipse 中 对 给 定 代 码 行 设 置 断 点 ,双击 该 行 代 码 。 这 时 会 出 现 一 个 断 点 符号 ， 如 图 2-2 
中 的 如 下 代码 行 所 示 。 


insert(x[num y]); 


E 了 设置 临时 断 点 ， 单 击 该 行 代码 ， 然 后 在 源 代 码 窗口 中 右 击 ， 并 选择 Run to Line。 然 而 要 
* 只 有 当 目 标 行 与 当 前 位 置 位 于 同一 个 函数 中 时 ， Run to Line 操 作 才 会 起 作用 ， 而 且 要 在 重 
MM 到 这 一 行 前 没有 退出 该 函数 才 行 。 


2.5 展开 GDB 示例 


因为 有 很 多 信息 ， 所 以 有 必要 举 一 个 可 以 照 兰 做 的 设置 断 点 的 简短 例子 。 来 看 下 面 的 多 文件 
CRAIE o 















































main.c: swapper.c: 
#include <stdio.h> void swap(int *a, int *b) 
mals taut ohh. f 
void swap(int *d, int *DJ; 1 
int c = xa; 

int main(void) #a = bs 
{ *b = c; 

int i = 3; } 

int j = 5; 


printf("i: %d, j: %d\n", i, j}; 
swap(&i, 8j); 
printf("i: Xd, j: %d\n", i, j); 


return 0; 


} 
编译 该 代 公 并 在 可 执行 文件 上 运行 GDB。 
$ gcc -g3 -Wall -Wextra -c main.c swapper.c 


$ gcc -o swap main.o swapper.o 
$ gdb swap 
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说 明 本 倒是 本 书 中 首次 编译 — 因此 这 里 作 一 下 说 明 。 上 述 编译 过 程 的 第 一 行 产 生 了 两 
个 目标 文件 ， 其 中 包含 带 调试 信息 的 未 决 目 标 代码 。 第 二 行将 目标 文件 连接 到 一 个 包含 所 有 
ee uu E cu as 








局 动 调试 会 话 时 在 main() 中 设置 断 点 是 很 常见 的 。 这 一 操作 在 该 函数 的 第 一 行 上 设置 断 点 。” 


(gdb) break main 
Breakpoint 1 at 0x80483f6: file main.c, line 6. 


下 面 的 所 有 示例 都 在 函数 swap() 的 第 一 行 上 设置 了 断 点 。 昌 然 看 上 去 可 能 不 同 ,但 是 它们 做 
的 都 是 同一 件 事 : 在 swap() 的 上 方 中 断 。 
(gdb) break swapper.c:1 


Breakpoint 2 at 0x8048454: file swapper.c, line 1. 
(gdb) break swapper.c: swap 














Rroabnnint 2 at nv9nASAERa- filo cwanne 
DECAKPOLTL 5 di VASU4ZO4IdG. TliC Swapper. 


(gdb) break swap 
Note: breakpoint 3 also set at pc 0x804845a. 
Breakpoint 4 at 0x804845a: file swapper.c, line 3. 


TEAL ZG EIN TH], GBA “MER, ADORE AVES HT “Won” Xp. AARE RAE MT 
命令 做 了 限定 ， 人 否则 都 是 在 具有 GDB 的 焦点 的 文件 上 执行 命令 。 默 认 情 况 下 ， 具 有 GDB 的 初始 
焦点 的 文件 是 包含 main() 国 数 的 文件 ， 但 是 当 发 生 如 下 任 一 动作 时 ， 焦 点 会 转移 到 不 同 的 文件 
B 

a 问 不 同 的 源 文件 应 用 1ist 命 令 。 

Q 进入 位 于 不 同 的 源 代码 文件 中 的 代码 。 

a 当 在 不 同 的 源 代 码 文件 中 执行 代码 时 GDB 过 到 断 点 。 

让 我 们 看 一 个 示例 。 虽 然 断 点 是 在 swapperc 中 设置 的 ， 但 是 我 们 实际 上 没有 列 出 该 文件 中 的 
代码 。 因 此 ， 焦 点 仍然 位 于 main.c 上 。 可 以 通过 在 第 6 行 上 设置 断 点 来 验证 这 一 点 。 当 不 市 文件 
名 地 设置 这 个 断 点 时 ，GDB 会 在 当前 活动 文件 的 第 6 行 上 设置 断 点 。 


(gdb) break 6 
Breakpoint 5 at Ox8048404: file main.c, line 6. 



































可 以 表 定 的 是 ，main.c 具 有 焦点 ， 当 启 动 GDB 时 ， 仪 仅 通过 行 号 设置 的 断 点 是 在 包含 main() 
的 文件 中 设置 的 。 可 以 通过 列 出 swapperc 中 的 代码 来 改变 焦点 。 


(gdb) list swap 
1 void swap(int xa, int xb) 





CD 断 点 可 能 不 是 恰好 在 main() 的 第 一 行 上 , 但 是 会 在 靠近 第 一 行 的 位 置 。 然 而 , 与 我 们 前 面 介 绍 这 一 点 的 示例 不 同 ， 
这 里 的 代码 行 是 可 执行 的 ， 因 为 它 为 i 赋 了 值 。 
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2. 3 

3 int c = sq. 

4 ka = xb; 

5 *b = c; 

6 } 

可 以 试看 在 第 6 行 上 设置 男 一 个 断 点 ， 来 确认 swapperc 现 在 具有 焦点 。 


(gdb) break 6 
Breakpoint 6 at 0x8048474: file swapper.c, line 6. 











可 以 看 出 ， 断 点 确实 是 在 swapperc 的 第 6 行 上 设置 的 。 然 后 将 在 swapperc 的 第 4 行 上 设置 一 个 
临时 断 点 : 


(gdb) tbreak swapper.c:4 
Breakpoint 7 at Ox8048462: file swapper.c, line 4. 


最 后 ， 使 用 2.3.1 节 介绍 的 ijnfo breakpoints 命 令 ， 来 展示 一 下 刚才 设置 的 所 有 上 断 点 的 阵容 。 


(gdb) info breakpoints 

Num Type Disp Enb Address What 

breakpoint keep 0x080483f6 in main at main.c:6 
breakpoint keep 0x08048454 in swap at swapper.c: 





Pon n0 AC” at JOammer £D 


lv aln vit Laan 1 ru Eira Ci * 
VAVOUGO4 Od Lii 5wap dt »wapptr.c. 


y 

y 

DICaKpoint KEEP y 

breakpoint keep y 0x0804845a in swap at swapper.c: 
breakpoint keep y 0x08048404 in main at main.c:9 
breakpoint keep y — 0x08048474 in swap at swapper.c:6 
breakpoint del y  0x08048462 in swap at swapper.c:4 


到 后 面 结束 GDB 会 话 时 ， 再 使 用 quit 命 令 离开 GDB。 


(gdb) quit 
$ 


2.6 ”断后 的 持久 性 


我 们 上 和 面 说 的 “后 面 ”是 指 在 调试 会 话 期 间 不 应 退出 GDB。 例如 ， 当 发 现 并 修复 了 一 个 程序 
首 误 ,但 是 其 他 程序 错误 仍然 存在 时 ,不 应 当 退 出 GDB 然 后 重新 进入 来 使 用 程序 的 新 版 本 。 这 样 
HBA LEDS hy Bast AEB, TM ARS NAGASE A To 

如 末 在 修改 和 重新 编 详 代码 时 没有 退出 GDB， 那 么 在 下 次 执行 GDB 的 run 命 令 时 ，GDB 会 感 
AES OEM, FFA SINHA 

然而 要 注意 ， 断 点 是 会 “移动 ”的 。 例 如 ， 来 看 下 面 这 个 简单 程序 。 


1 main() 
o { int x,y; 


-~ Ow & Ww N eS 
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3 = 1; 
4 = 2; 
j 
编译 该 程序 ， 进 入 GDB， 并 在 第 4 行 设置 一 个 断 点 。 
(gdb) 1 
1 main() 
2 { int x,y; 
3 x= 1; 
4 y = 2; 
5 } 
(gdb) b 4 
Breakpoint 1 at Ox804830b: file a.c, line 4. 
(gdb) r 


Starting program: /usr/home/matloff/Tmp/tmp1/a.out 


Breakpoint 1, main () at a.c:4 


4 y-2j 

一 切 正常 。 但 是 假设 现在 添加 一 行 源 代 公 。 

1 main() 

> { int x,y; 

8 X = 1; 

! X++; 

5 y= 2; 

6 } 

然后 重新 编 详 《同样 ， 记 住 并 没有 离开 GDB)， 并 再 次 执行 GDB 的 run 命 令 。 
(gdb) r 


The program being debugged has been started already. 

Start it from the beginning? (y or n) y 
"/usr/home/matloff/Tmp/tmpi/a.out' has changed; re-reading symbols. 
Starting program: /usr/home/matloff/Tmp/tmp1/a.out 


Breakpoint 1, main () at a.c:4 


4 Xt 
GDB 确 实 重 新 加 载 了 新 代码 ， 但 是 断 点 似乎 从 下 面 的 语句 : 
y-2 





移 到 了 如 下 语句 : 


X++; 


50 — $23 停 下 来 环顾 程序 


仔细 看 一 下 将 发 现 断 点 实际 上 根本 没有 移动 : 断 点 本 来 在 第 4 行 ， 现 在 仍然 在 第 4 行 。 但 是 那 
一 行 不 再 是 原来 在 其 上 设置 断 点 的 语句 。 因 此 ， 需要 通过 删除 这 个 断 点 并 设置 一 个 狐 断 点 来 移动 
靳 点 。CDDD 中 的 做 法 容易 得 多 ， 参 见 2.7.5 季 。) 

最 后 ， 假 设 因为 该 吃饭 、 上 睡觉 或 体 有 号， 而 需要 结束 当前 调试 会 话 。 如 果 你 一 般 没 有 持续 开机 
的 习惯 ， 束 需要 退出 调试 莫 。 有 没有 什么 方法 可 以 保存 汤 点 呢 ? 

对 于 GDB 和 DDD， 在 某 种 程度 上 答案 是 肯定 的 。 可 以 将 断 点 放 在 源 代码 所 在 目录 (或 者 从 
中 调用 GDB 的 目录 ) 的 .gdbinit 启 动 文件 中 。 

如 果 在 使 用 Eclipse， 则 比较 笠 运 ， 因 为 所 有 上 断 点 都 会 被 目 动 保存 ， 并 且 在 下 一 个 Eclipse 会 话 
中 恢复 。 


2.7 ”删除 和 禁用 断 点 


在 调试 会 话 期 间 ， 有 时 会 发 现 有 的 断 点 不 再 有 用 。 如 采 人 确认 不 再 需要 该 断 点 ， 可 以 删除 它 。 

也 可 能 是 这 样 的 情况 : 你 认为 断 扣 会 在 调试 会 话 之 后 还 有 用 ,也许 你 不 想 删除 断 点 ， 而 十 打 
算 将 它 虚 置 起 来 ， 让 调试 器 暂时 不 会 在 该 断 点 处 中 断 。 这 称 为 茶 用 断 点 。 如 果 以 后 再 次 需要 ， 可 
DA og HIS es. 

As B SP ZR RAVER HIE. ESE 71) Z1 ERE EPEE H T HU eae 


2.7.1 在 GDB 中 删除 断 点 


如 果 确 认 不 再 需要 当前 断 点 (也许 是 因为 修复 了 那个 特定 程序 错误 ), 那么 可 以 删除 该 断 点 。 
GDB 中 有 两 个 用 来 删除 断 点 的 命令 ,delete 命 令 用 来 基于 标识 和 侍 删 除 断 上 ,clear 命 令 使 用 与 2.4.1 
市 所 介绍 的 创建 断 点 相同 的 语法 删除 断 点 。 

€ delete breakpoint List 

删除 断 点 使 用 数值 标识 符 〈 已 经 在 2.3 节 介绍 )。 断 点 可 以 是 一 个 数字 ， 比 如 delete 2 删除 第 
二 个 断 点 ; 也 可 以 是 一 系列 数字 ， 比 如 delete 2 4 删除 第 二 个 和 第 四 个 断 点 。 

@ delete 

删除 所 有 上 断 点 。 除 非 执 行 set confirm off 命 令 《〈 它 也 可 以 放 在 .gg2pzzi 朋 动 文 件 中 )， 人 否则 
GDB 会 要 求 确 认 删 除 操 作 。 

€ clear 

消除 GDB 将 执行 的 下 一 个 指令 处 的 断 点 。 这 种 方法 适用 于 要 删除 GDB 已 经 到 达 的 断后 的 情 
Di. 


€ clear function, clear filename:function, clear Line number Je clear filename: 





















































Line number 
这 些 命令 根据 位 置 清除 断 点 ， 工 作 方式 与 对 应 的 break 命 令 相 似 。 
例如 ， 假 设 使 用 如 下 命令 在 foo() 的 入 口 处 设置 断 点 。 


(gdb) break foo 
Breakpoint 2 at 0x804843a: file test.c, line 22. 
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可 以 用 来 删除 该 断 点 的 代码 为 : 


(gdb) clear foo 
Deleted breakpoint 2 


或 者 


(gdb) delete 2 
Deleted breakpoint 2 


2.7.2 ”在 GDB 中 禁用 断 点 


每 个 断 点 都 可 以 被 启用 或 禁用 。 只 有 当 GDB 遇 到 局 用 的 断 点 时 ， 才 会 暂停 程序 的 执行 ; 它 会 
忽略 茶 用 的 断 点 。 默 认 情 况 下 ， 上 断 点 的 生命 期 从 局 用 时 开始 。 

ATA BAA Ae? 在 调试 会 话 期 间 , 会 遇 到 大 量 断 点 。 对 于 经 名 重复 的 循环 结构 或 函数 ， 
这 种 情况 使 得 调试 极 不 方便 。 如 果 要 保留 断 点 以 便 以 后 使 用 ， 同 时 又 不 希望 GDB 停 止 执行 ， 可 以 
禁用 它们 ， 在 以 后 需要 时 再 局 用 。 

使 用 disable breakpoint-List 命 令 禁 用 汤 点 ， 使 用 enable breakpoint-Listíi- HATA, 
其 中 preakpoint-List 是 由 空格 分 阳 开 的 多 个 断 点 标识 从 。 例 如 ， 


(gdb) disable 3 














将 禁用 第 三 个 断 点 。 类 似 地 ， 
(gdb) enable 1 5 


将 局 用 第 一 个 和 第 五 个 断 点 。 

不 市 任何 参数 地 执行 disable 命 令 将 禁用 所 有 现存 断 点 。 类 似 地 ， 不 市 参数 地 执行 enable 命 
RSA PTA SA IT o 

还 有 一 个 enable once, ZA FARI DEGDBTITEIATTIRASHI UE. WEN: 








enable once breakpoint-list 





MU, enable once 3 会 使 得 断 点 3 在 下 次 导致 GDB 停 止 程序 的 执行 后 被 禁用 。 这 个 命令 与 
tbreak 命 令 非 常 类 似 ， 但 是 当 过 到 汤 点 时 ， 它 是 禁用 断 点 ， 而 不 是 删除 断 点 。 


2.7.3 在 DDD 中 删除 和 禁用 断 点 


在 DDD 中 删除 断 点 与 设置 断 点 一 样 方便 。 与 设置 断 点 时 一 样 ， 将 光标 放 在 红色 俘 止 符号 上 ， 
并 右 击 鼠标 。 弹 出 菜单 中 将 有 一 个 选项 是 Delete Breakpoint。 按 住 鼠 标 右键 ， 并 拖 动 鼠 标 ， 直 到 
突出 显示 这 个 位 置 。 然 后 释放 鼠标 投 键 ， 将 看 到 红色 停止 符号 消 失 了 ， 表 示 断 点 已 被 删除 。 

在 DDD 中 禁用 断 点 与 删除 断 点 非常 相似 。 右 击 并 按 住 红色 停止 从 写 ， 并 选择 Disable 
Breakpoint。 红 色 仿 止 符号 会 变 成 灰色 ， 表 示 汤 点 仍然 存在 ， 但 已 经 禁用 了 。 
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还 可 以 使 用 DDD 的 Breakpoints and Watchpoints 窗 口 ， 如 图 2-1 所 示 。 可 以 单 击 断 点 入 口 来 突 
出 显示 ， 然 后 选择 Delete、Disable 或 Enable。 

事实 上 ， 可 以 通过 将 鼠标 拖 到 上 面 来 突出 显示 该 窗口 中 的 几 个 条 目 ， 如 图 2-3 所 示 。 因 此 可 
以 立即 删除 、 芭 用 或 司 用 多 个 断 点 。 








DDD 7home;nmjDebug/Book7main.c 


#include «stdio.h 


void swap(int *a, DDD: Breakpoints and Watchpoints 


int main(void) x m NC MIN NT 2 
Disp Enb Address 


JY || breakpoint ^ keep y ^ Ox080483ad in main al 

intu eds [breakpoint already hit 1 time _ | 

printf( 1: %a,| PEE keep EE 

Q swap(&i, &j); | EAEE RN 

printf("i: %d,|Ħ3 breakpoint keep y 0x08048400 in swap a 
{breakpoint already hit 1 time 





return 0; 


(gdb) cont 
Te aS jr 





Breakpoint 2, main () at main.c:13 
(gdb) 











图 2-3 在 DDD 中 删除 /禁用 /局 用 多 个 断 点 


当 在 断 点 窗口 中 单 击 Delete 按 钮 后 , 屏幕 看 上 去 如 图 2-4 所 示 。 显 然 , 有 两 个 老 断 点 现在 消失 了 。 


DDD: /home/nm/Debug/Book/ main.c 











finclude «stdio.h 
void swap(int *a, 
int main(void) prove Lookup Prat. miU Diese pete 
{ Num Type Disp Enb Address What 

3 breakpoint keep y Ox08048400 in swap a 
übreakpoint already hit 1 time 


int T 23 

Tnt. j 25; 
printf("i: 96d, 
swap(&i, &j); 


printf("i: Xd, 


return 0; 


"a wy gu 


Breakpoint 2, main () at main.c:13 
(gdb) delete 1 2 
(gdb) 











图 2-4 两 个 被 删除 的 断 点 
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2.7.4 在 Eclipse 中 删除 和 禁用 断 点 


与 在 DDD 中 一 样 , 可 以 在 Eclipse 中 通过 单 击 当 前 活动 的 代码 行 中 的 断 点 符号 来 删除 或 禁用 断 
点 。 这 时 会 弹出 一 个 菜单 ， 如 图 2-5 所 示 。 注 意 ，Toggle 选 项 意味 着 删除 断 点 ， 而 Disable/Enable 
的 意思 显而易见 。 




















二 Debug - insert_sorUins<c - Eclipse Platform BEE 
File Edit Refactor Navigate Search Project Run Window Help 

| Car B |$- 07 Q |e | Bir Fle - Or Or E |%Debug]  ” 
($5 Debug 2N = D |o Breakpoints 23 \ 6% Variables | E 








Be xXexwm5sgv- 
© /workspace/insert_sort/ins.c [line: 30] 















































I moort (vy [ rim i1) 
f 
| Toggle Breakpoint 











in 
Disable Breakpoint € num. inputs : int 
Breakpoint Properties... € num y: int 
e t args(int, char**) : void 
Add Bookmark... get-arg 
Add Task... 


9 scoot over(int) : void 
RETE PENES 











(B [ZI Show Quick Diff Shift+Ct+Q 
N O Show Line Numbers 


J- r$ 








Folding 








Preferences... 
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图 2-$ 在 Eclipse 中 删除 /禁用 断 点 





类 似 于 DDD 的 断 点 窗口 ，Eclipse 有 Breakpoint 视 图 ， 在 图 2-5 所 示 界 面 的 右上 方 。 与 DDD 中 需 
要 请 求 Breakpoints and Watchpoints 窗 口 的 情况 不 同 ，Eclipse 的 Breakpoints 视 图 是 在 Debug 透 视 儿 
中 目 动 显示 的 。( 不 过 ， 如 采 屏 项 空间 不 够 ， 可 以 单 击 右上 省 的 X 将 它 隐 茂 起 来 。 如 末 以 后 要 使 
它 恢 复 ， 选 择 Window 一 Show Views 一 Breakpoints。) 

Eclipse Breakpoints 视 图 的 优点 是 可 以 单 击 双 X 图 标 (Remove All Breakpoints ) 。 在 编程 过 程 中 
需要 这 么 做 的 机 会 往往 比 你 想象 的 要 多 。 在 长 调试 会 话 中 的 有 些 地 方 , 会 发 现 你 以 前 设置 的 断 点 
现在 没有 一 个 是 有 用 的 ， 因 此 要 把 它们 全 部 删除 。 

2.7.5 fEDDD# “tah” MA 


DDD 的 另 一 个 真正 优秀 的 功能 是 拖 放 断 点 。 单 击 并 按 住 源 窗口 中 的 断 点 停止 符号 ， 只 要 保持 
按 下 鼠标 左 键 ， 就 可 以 将 断 点 拖 到 源 代 码 中 的 男 一 个 位 置 。“ 莫 后 ”凡生 的 事情 是 DDD 删 除了 原 
来 的 断 点 ， 并 设置 了 一 个 具有 相同 属性 的 新 断 点 。 因 此 ， 你 将 发 现 新 断 点 与 老 断 点 完全 相同 ， 只 
是 数字 标识 符 不 同 。 当 然 ， 也 可 以 使 用 GDB 做 这 件 事 ， 但 是 DDD 加 速 了 这 一 过 程 。 

图 2-6 说 明了 这 一 点 ， 这 是 在 断 点 移动 操作 中 的 截图 。 下 面 的 代码 行 上 原来 有 一 个 断 点 。 


if (new y < y[i]) { 


RATE SERA EUER BUG BT IN E 
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v | DDD: /root/Debug/ins.c 


ins.c:3% S) 


y[k] = y[k-11; 


void insert(int new y) 
Lt dne: 


if (num y = 0) { // y empty so far, easy case 
y[0] = new y; 


return; 


// need to insert just before the first y 
// element that new v is less than 
for (j = 0; J « numy; je t€ 
if (new y < y[j]) € 
// shift yO. yH. * y Saar 
// before inserting n 
scoot over(j); 
y[j] = new y; 
return; 





void process dataQ 
i ser 0; num y < num inputs; num y) 
// among y[0 [num y-1] 
Tert cathun o Di 


rd BE joe rusa es) 


for (i « num inputs; i++) 
ainet sii" yl 13; 


GNU DDD 3.3.11 ‘ot Ting gna by Dorothea LUsing host libthread db 
Hear SL A db.so 

(gdb) break in ? 

Breakpoint 1 i 028048467: file ins.c, line 3?. 

(gdb) I 





图 2-6 ÆDDDP "4929" WA 
scoot over(j); 


PON ae AST ERSE Ss, JPR EH Bere E. FEA, BOMBA PE il is 
fee, Db. JOR ANE ILA S VPA EARL, GT Eth TA “28” BRIERE Ss. — ERE de 
键 ， 老 代码 行 上 的 停止 符号 驶 会 消失 ， 新 行 上 出 现 一 个 停止 符号 。 

为 什么 这 样 做 很 有 用 呢 ?” 痛 先 ， 如 果 处 于 要 删除 一 个 断 点 并 添加 男 一 个 断 点 的 情况 下 ， 这样 
可 以 一 气 呵 成 完成 两 个 操作 。 但 是 更 重要 的 是 ， 如 2.6 厄 所 提 到 的 那样 ， 当 添加 或 删除 源 代码 行 
时 ， 有 部 分 行 的 行 号 发 生 了 变化 ， 从 而 将 现 有 上 断 点 “转移 到 ”了 不 打算 设置 断 点 的 行 上 。 在 GDB 
中 ， 这 束 需 要 在 每 个 受 影 啊 的 断 点 处 进行 删除 断 点 和 创建 新 断 点 的 操作 。 这 样 做 是 很 索 琐 的 ， 尤 
其 是 当 部 分 断 点 有 附加 条 件 时 更 麻烦 。 但 是 在 DDD 中 ,可 以 直接 将 停止 符号 图 标 拖 到 新 位 置 ， 这 
样 操 作 非 党 方便 。 

2.76 DDD 中 的 Undo/Redo 断 点 动作 


MEN 可 通过 单 击 Edit 用 到 。 以 图 2-3 和 图 2-4 中 的 情况 为 
例 。 假 设 你 突然 意识 到 不 想 删 除 那 两 个 断 点 (也 许 只 是 希望 禁用 它们 )， 可 以 选择 Edit 一 Undo 
Delete, E (也 可 以 单 击 命 令 工 具 中 的 Undo， 但 是 通过 Edit 访 问 会 更 好 ， 这 样 DDD 会 
提醒 我 们 将 撤销 什么 操作 。) 
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DD: Breakpoints and Watchpoints 


Disp Enb Address t 
3 breakpoi nt keep y .0x08048400 in swap a 














图 2-7 在 DDD 中 恢复 两 个 断 点 


2.8 ”进一步 介绍 浏览 断 点 属性 


每 个 断 点 都 有 各 种 属性 一 一 行 写 、 加 在 断 点 上 的 条 件 (如 果 有 的 话 》、 m 
RA ]14E2.3 PSP A Y — SUL T ER ERES S PERS PIE, MERATE AE 


2.8.1 GDB 


2.3.1 节 中 介绍 过 , GUEEBUREA Br na PS BUR ME A s 设置 的 第 一 个 断 点 被 赋予 
“1” 其 后 的 每 个 新 断 点 都 被 赋予 上 一 个 标识 符 加 1。 每 个 断 点 也 有 一 些 控制 调整 其 行为 的 属性 。 
使 用 唯一 标识 符 ， 可 以 分 别 调整 各 个 断 点 的 属性 。 

可 以 使 用 info breakpoints 命 令 〈 简 写 为 1 b) 来 列 出 设置 的 所 有 上 断 点 及 其 属性 。info 
breakpoints 的 输出 看 上 去 大 体 如 下 : 


(gdb) info breakpoints 























Num Type Disp Enb Address What 

1  breakpoint keep y | 0x08048404 in main at int swap.c:9 
breakpoint already hit 1 time 

2 breakpoint keep n | 0x08048447 in main at int swap.c:14 

3  breakpoint keep y 0x08048460 in swap at int swap.c:20 
breakpoint already hit 1 time 

4 hw watchpoint keep y counter 


让 我 们 详细 分 析 一 下 info breakpoints 的 这 一 输出 。 
(1) 标识 符 (Num): 断 点 的 唯一 标识 符 。 
(2) 类 型 (Type): 这 个 字段 指出 该 断 点 是 断 点 、 监 视点 还 是 捕获 点 。 
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(3) 部 署 〈Disp): 每 个 断 点 都 有 一 个 部 署 ， 指 示 断 点 下 次 引起 GDB 和 暂停 程序 的 执行 后 该 断 点 
上 会 发 生 什么 事情 。 可 能 的 部 署 有 以 下 3 种 。 

O 保持 (keep)， 下 次 到 达 断 点 后 不 改变 断 点 。 这 是 新 建 断 点 的 默认 部 署 。 

O 删除 (del)， 下 次 到 达 断 点 后 删除 该 断 点 。 使 用 tbreak 命 令 创 建 的 任何 断 点 都 是 这 样 的 

rex CUL2.4.1 15). 
O 禁用 (dis)， 下 次 到 达 断 点 时 会 禁用 该 断 点 。 这 是 使 用 enable once 命 令 设 置 的 断 点 〈 见 
2 

(4) 局 用 状态 (Enb): 这 个 学 段 说 明 断 点 当前 是 局 用 还 是 禁用 的 。 

(5) 地 址 〈Address): 这 是 内 存 中 设置 断 点 的 位 置 。 它 主要 供 汇编 语言 程序 员 或 者 试图 调试 
没有 用 扩充 的 符号 表 编 译 的 可 执行 文件 的 人 使 用 。 

(6) MLE (What): 正如 我 们 讨论 过 的 ， 各 个 断 点 位 于 源 代 码 中 的 特定 行 上 。What 字 段 显示 了 
断 点 所 在 位 置 的 行 号 和 文件 名 。 

对 于 监视 点 ， 这 个 字段 表示 正在 监视 哪个 变量 。 因 为 变量 实际 上 是 带 名 称 的 内 存 地 址 ， 而 内 
存 地 址 则 是 一 个 位 置 。 

可 以 看 到 ， 除 了 列 出 所 有 上 断 点 及 其 属性 ， 使 用 i b 命 令 也 能 指出 特定 断 点 引起 GDB 停 止 程序 
执行 多 少 次 。 例 如 ， 如 果 循 环 中 有 一 个 断 点 ， 这 个 命令 马上 会 告诉 你 到 目前 为 止 循环 执行 了 多 少 
次 迭代 ， 这 会 非常 有 用 。 

2.8.2 DDD 


从 图 2-1 中 可 以 看 出 ，DDD 的 Breakpoints and Watchpoints 窗 口 提供 的 信息 与 GDB 的 info 
breakpoints 命 令 提供 的 信息 相同 。 然 而 ，DDD 的 窗口 方式 比 GDB 的 命令 更 方便 ， 因 为 可 以 经 各 
性 地 显示 这 个 窗口 〈 即 将 它 放 在 屏 项 边 上 )， 因 此 不 需要 在 每 次 要 奏 看 断 点 时 都 执行 命令 。 

2.8.3 Eclipse 


再 次 ， 如 前 面 图 2-2 所 示 ，Eclipse 的 Breakpoints 视 图 可 以 经 滑 地 显示 断 点 及 其 属性 。Eclipse 
的 信息 比 DDD 的 信息 略 少 ， 因 为 它 没有 指出 到 目前 为 止 已 遇 到 断 点 多 少 次 〈 甚 全 Properties 窗 口 
中 都 没有 这 一 信息 )。 


2.9 恢复 执行 


知道 如 何 指示 调试 圳 在 何 处 或 何 时 暂停 程序 的 执行 很 重要 , 但 是 知道 如 何 指示 调试 磊 恢 复 执 
行 同样 重要 。 毕 竟 ， 仅 仪 查 看 变量 可 能 不 够 。 有 时 需要 知道 变量 的 值 是 如 何 与 代码 的 其 余部 分 交 
互 的 。 

我 们 在 第 1 革 介 绍 过 确认 原则 : 要 一 处 处 确认 攻坚 变 量 有 你 认为 它们 应 该 具有 的 值 ， 直 人 至 过 
到 一 个 与 你 的 预期 不 符 之 处 。 然 后 这 种 不 符 将 是 一 种 线索 ， 很 可 能 加 是 程序 错误 所 在 的 位 置 。 但 
征 通 币 这 种 不 待机 经 过 多 个 断 点 处 暂 俘 并 恢复 执行 时 才 会 友 生 《或 者 在 同一 个 断 氮 上 多 次 暂停 并 
恢复 )。 因 此 ， 在 断 点 处 恢复 执行 与 设置 断 点 本 喘 同 样 重 要 ， 这 吏 是 为 什么 调试 工具 通 钊 会 有 相 
当 丰 军 的 恢复 执行 的 方法 。 
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恢复 执行 的 方法 有 3 类 。 第 一 类 是 使 用 step 和 next“ 单 步 ” 调 试 程序 ， 仅 执行 代码 的 下 一 行 
然后 再 次 暂停 。 第 二 类 由 使 用 continue 组 成 ， 使 GDB 无 条 件 地 恢复 程序 的 执行 ， 直 到 和 它 遇 到 另 
一 个 断 点 或 者 程序 结束 。 最 后 一 类 方法 涉及 条 件 : 用 finish 或 until 命 令 恢复 。 在 这 种 情况 下 ， 
GDB 会 恢复 执行 ， 程 序 继续 运行 下 到 遇 到 某 个 预先 确定 的 条 件 《〈 比 如 ， 到 达 函 数 的 末尾 )， 或 者 
到 达 另 一 个 断 点 ， 或 者 程序 完成 。 

下 面 将 依次 介绍 GDB 的 各 种 恢复 执行 的 方法 ， 然 后 介绍 如 何在 DDD 和 Eclipse 中 执行 这 样 的 
BRE. 

2.9.1 在 GDB 中 


本 方 站 和 完 讨 论 GDB 在 断 点 处 暂 仿 后 的 各 种 恢复 执行 的 方法 。 

1. 使 用 step 和 next 单 步调 试 

一 旦 GDB 在 断 点 处 停止 ， 可 以 使 用 next( 人 简写 为 %) 和 step〈 人 简写 为 s) 命令 来 单 步调 试 代码 。 
当 触 发 了 断 点 ， 并 且 GDB 和 暂停 后 ， 可 以 使 用 next 和 step 来 执行 紧 接 着 的 下 一 行 代 人 码 。 当 执行 了 这 
一 行 后 ，GDB 会 再 次 上 斩 仓 ， 并 给 出 一 个 命令 行 提示 符 。 让 我 们 看 一 下 这 一 过 程 鸭 实际 使 用 ， 来 看 
代码 清单 2-1。 


代码 清单 2-1  swapflaw.c 


1 /* Swapflaw.c: A flawed function that swaps two integers. */ 
» #include <stdio.h> 
s void swap(int a, int b); 























int main(void) 


{ 


7 int 1 = 4; 

8 int j = 6; 

9 

10 printf("i: %d, j: dl s i, j); 
n swap(i, j); 


12 printf("i: 4d, j: %d\n", i, j); 


i return 0; 


is} 
i7 void swap(int a, int b) 


C = ð; 
20 a = b; 
C; 


我 们 将 在 main() 的 入 口 处 设置 一 个 断 点 ， 并 在 GDB 中 运行 程序 。 
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$ gcc -g3 -Wall -Wextra -0 swapflaw swapflaw.c 

$ gdb swapflaw 

(gdb) break main 

Breakpoint 1 at 0x80483f6: file swapflaw.c, line 7. 
(gdb) run 

Starting program: swapflaw 

Breakpoint 1, main () at swapflaw.c:7 

7 int i = 4; 


GDB 现 在 位 于 程序 的 第 7 行 , 这 意味 看 第 7 行 还 没有 执行 。 我 们 可 以 使 用 next 命 令 来 执行 这 行 
代码， 这 样 来 到 第 8 行 前 面 : 








(gdb) next 

8 int j = 6; 

我 们 将 使 用 step 来 执行 下 一 行 代 码 ( 第 8 行 )， 执 行 后 使 我 们 移 到 第 10 行 。 
(gdb) step 

10 printf("i: %d, j: %d\n", i, j); 





我 们 看 到 next 和 step 都 能 执行 下 一 行 代码 。 因 此 一 个 重要 问题 是 :“ 这 两 个 命令 的 不 同 之 处 
在 哪里 ? ”它们 似乎 都 能 执行 下 一 行 代码 。 这 两 个 命令 的 区 别 是 它们 如 何 处 理 函 数 调用 : next 
执行 函数 ， 不 会 在 其 中 暂停 ， 然 后 在 调用 之 后 的 第 一 条 语句 处 暂停 ， 而 step 在 函数 中 的 第 一 个 语 
名 处 暂 俘 。 

对 swap() 的 调用 出 现在 第 11 行 。 让 我 们 比较 一 下 next 和 step 的 效果 。 








使 用 step : 使 用 next : 

(gdb) step (gdb) next 

wA uu i: 4, j: 6 

11 swap(i, j); 11 swap(i, j); 
(gdb) step (gdb) next 

swap (a-4, b-6) at swapflaw.c:19 12 printf("i: 4d, j: 4d\n", i, j); 
19 int c = a; (gdb) next 

(gdb) step i: 4, j: 6 

20 a-b; 14 return 0; 
(gdb) step 

21 b=c; 

(gdb) step 

22 } 

(gdb) step 

main () at swapflaw.c:12 

12 printf( 12: 4d, j: %d\n", i, j); 

(gdb) step 

i 33.7]: 


14 return 0; 
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step 命 令 的 运行 方式 与 你 预期 的 可 能 一 样 。 该 命令 在 第 10 行 执行 printf(), 然后 在 第 11 行 * 调 
用 swap()， 然 后 它 开 始 执行 swap() 中 的 代码 行 。 这 称 为 单 步 进入 (stepping into) 函数 。 一 旦 我 们 
用 step 授 历 了 swap() 的 所 有 代码 行 ，step 束 会 把 我 们 禹 回 到 main()。 

相反 地 ， 似 乎 next 永 远 不 会 离开 main()。 这 是 两 个 命令 的 主要 区 别 。next 将 函数 调用 看 做 一 
行 代码 ， 并 在 一 个 操作 中 执行 整个 函数 ， 这 称 为 单 步 越过 (stepping over) PAA. 

然而 , 不 要 受 假 相 蒙蔽 。 虽然 看 上 去 似乎 next 越 过 了 swap() 的 主体 , 但 是 它 并 未 真 的 单 步 “ 越 
过 ”任何 内 容 。GDB 安 静 地 执行 swap() 的 每 一 行 ， 不同 我 们 显示 任何 细节 (虽然 它 显 示 了 swap() 
可 以 输出 的 任何 屏 天 输出 )， 并 且 没 有 提示 我 们 执行 函数 中 的 各 行 代码 。 

单 步 进入 函数 〈step 命 令 的 操作 ) 和 早 步 越过 函数 (next 命令 的 操作 ) ZIAD AY PES AE AH 25 5 
要 的 概念 ， 所 以 为 了 不 大 其 烦 地 强调 其 重要 性 ， 我们 用 图 来 演示 next 和 step 之 则 的 区 列 ， 图 中 用 
篆 头 显示 程序 执行 顺序 。 

图 2-8 说 明了 step 命 令 的 行为 。 想 象 一 下 程序 在 第 一 个 printf() 语 句 处 暂停 。 该 图 显示 了 各 
个 step 语 句 会 将 我 们 市 到 何 处 。 
































int main(void) 


int i 
int j 


printf("i: Xd, j: %d\n", i, Í); 
swap(i, 115 
printf("i: Xd, j: %d\n", i, j); 


return 0; 


l 


void swap(int a, int b) 





图 2-8 step. HEA pe 


图 2-9 说 明了 同样 的 事情 ， 不 过 使 用 的 是 next。 

应 该 使 用 next 还 是 step， 取 雇 于 要 做 的 事情 。 如 宋 是 在 没有 函数 调用 的 那 部 分 代码 中 ， 那 么 
可 以 随意 。 这 时 两 个 命令 是 完全 相同 的 。 

然而 ， 如 果 调 试 中 要 单 步 进 入 一 个 你 知道 没有 程序 错误 (或 者 与 你 在 试图 跟踪 的 程序 错误 无 

















CD 你 可 


能 会 疑惑 , 为 什么 step 没 有 将 你 带 到 函数 printf() 的 第 一 行 。 原因 是 GDB 不 会 在 不 具有 调试 信息 的 代码 ( 即 
符号 表 ) 内 


停止 。 从 C 库 中 引入 的 函数 printf() 是 这 样 的 一 个 代码 示例 。 





AO 的 函数 中 ， 那 么 显然 使 用 next 可 以 避免 单 步调 试 该 函数 的 每 一 行 。 


int main(void) 


int i = 4; 
int j = 6; 


printf( 3: Xd, j: %d\n", i, j); 3 next 
swap(i, j); 
printf("i: %d, j: 4dWn", i, j); p ——» next 


return 0; 


} 


void swap(int a, int b) 





图 2-9 next PERSE pk ay 
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国 数 调用 ， 那 么 一 般 使 用 next 比 使 用 step 更 好 。 在 这 种 情况 下 使 用 next 之 后 ， 立 即 要 检查 调用 的 
结果 是 否 正 确 。 如 果 正 确 ， 那 么 程序 错误 很 可 能 不 在 函数 中 ， 这 意味 看 使 用 next 而 不 是 step 能 够 
节省 单 步调 试 每 一 行 的 时 间 和 精力 。 为 一 方面 ， 如 果 函 数 的 结果 不 正确 ， 可 以 在 函数 调用 时 设置 
一 个 临时 断 点 来 重新 运行 程序 ， 然 后 用 step 进 入 函数 。 

next 和 step 命 令 都 采用 一 个 可 选 的 数值 参数 ， 表 示 要 使 用 next 或 step 执 行 的 额外 行 数 。 换 言 
Z, next 3 与 在 一 行 中 键入 next 三 次 (或 者 键入 next 一 次 ， 然 后 按 下 ENTER 键 两 次 ) 的 作用 相 
I]. “图 2-10 说 明了 next 3 的 作用 。 




















void swapper(int *a, int *b) 


intg eqs 

Kg = *b; 

*h = ps next 3 
printf("swapped!Nn"); 


图 2-10 "XX next 





(D Vim 用 户 应 该 很 习惯 指定 给 定 命令 次 数 的 含义 。 


2. 使 用 continue 恢 复 程序 执行 

第 二 种 恢复 执行 的 方法 是 使 用 continue 命 令 ， 简 写 为 c。 与 仅 执行 一 行 代 码 的 step 和 mext 相 
反 ， 这 个 命令 使 GDB 恢 复 程 序 的 执行 ， 直 到 触发 断 点 或 者 程序 结束 

continue 命 令 可 以 接受 一 个 可 选 的 整数 参数 n。 这 个 数字 要 求 GDB 忽 略 下 面 n 个 断 点 。 例 如 ， 
continue 3 让 GDB 恢 复 程 序 执行 ， 并 忽略 接 下 来 的 3 个 断 点 。 

3. 使 用 finish 恢 复 程序 执行 

一 旦 触发 了 断 点 ， 束 使 用 next 和 step 命 令 逐 行 执 行程 序 。 有 了 时 这 是 一 个 痛 苗 的 过 程 。 例 如 ， 
假 议 GDB 到 达 了 函数 中 的 一 个 断 点 。 你 已 查看 了 几 个 变量 ， 并 且 收 集 了 需要 的 所 有 信息 。 这 上 时， 
你 没有 兴趣 也 不 需要 蛙 步 调试 函数 的 其 余部 分 , 想 返 回 到 这 个 函数 之 前 GDB 上 所 在 的 调用 函数 。 然 
而 ， 如 果 要 做 的 只 是 跳 过 函数 的 其 余部 分 ， 那 么 再 设置 一 个 无 天 断 点 并 使 用 continue 似 乎 比较 浪 
Sto TAIN VIA finish? 

finish 命 令 〈 简 写 为 fin) 指示 GDB 恢 复 执 行 ， 直 到 恰好 在 当前 栈 帧 完成 之 后 为 止 。 也 就 古 
说 ， 这 和 意味 看 如 果 你 在 一 个 不 是 main() 的 函数 中 ，finish 命 令 会 导致 GDB 恢 复 执 行 ， 直 到 恰好 在 
函数 返回 之 后 为 止 。 图 2-11 说 明了 finish 的 使 用 。 




















void swapper(int *a, int *b) 


lint c = "a; 

Ka = *b; 

“b ~ E + » 
printf("swapped!Nn"); finish 








图 2-11 finish 恢 复 执行 ， 直 到 当前 函数 返回 为 止 


虽然 可 以 键入 next 3 而 不 是 finish， 但 是 键入 后 者 更 容易 ， 这 样 会 对 行进 行 计数 〈6 行 以 上 
的 内 容 都 显得 多 余 )。 

看 上 去 finish 似 乎 没有 执行 每 一 行 代码， 因为 它 将 你 带 到 了 疯 数 的 压 部 , 但 是 实际 上 它 执 行 
了 每 一 行 代 码 。 除 非 为 了 显示 程序 的 输出 ， 否 则 GDB 执 行 每 行 代码 时 不 会 暂停 ”。 

finish 的 男 一 个 常见 用 途 是 当 不 小 心 单 步 进 入 原本 希望 蛙 步 越过 的 函数 时 (换言之 ， 当 需要 使 
用 next 时 使 用 了 step)。 在 这 种 情况 下 ， 使 用 finish 可 以 将 你 正好 放 回 到 使 用 next 会 到 的 位 置 。 

如 末 在 一 个 加 归 函 数 中 ，finish 只 会 将 你 禹 到 递归 的 上 一 层 。 这 是 因为 每 次 调用 都 外 看 做 是 
一 次 函数 调用 ， 因 为 每 次 调用 都 有 各 目的 栈 帧 。 如 果 要 在 递归 层次 较 高 时 完全 退出 递归 函数 ， 那 
么 更 适合 使 用 临时 断 点 及 continue， 或 者 用 until1 命 令 。 下 面 我 们 将 讨论 until。 

4. 使 用 until 恢 复 程 序 执行 

表面 介绍 过 ，finish 命 令 在 不 进一步 在 图 数 中 暂停 〈 除 了 中 间断 点 ) 的 情况 下 完成 当前 函数 
KIHT. XA, utilas (ASN) 通常 用 来 在 不 进一步 在 循环 中 暂停 (除了 循环 中 的 中 间 
































O 如 果 有 任何 介 于 其 间 的 断 点 ，finish 都 会 在 其 上 暂停 。 
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Wr) 的 情况 下 完成 正在 执行 的 循环 。 来 看 如 下 代码 厂 断 。 


...previous code... 


int i - 9999; 

while (i--) { 
printf("i is %d\n", i); 
seer lots of code «ss 

} 


...future code... 


假设 GDB 在 while 语 名 的 一 个 断 点 上 停止 , 你 查看 了 一 些 变 量 , 现在 打算 离开 循环 来 调试 “未 
来 的 代码 ”。 

问题 是 i 相当 大 ， 使 用 next 来 完成 循环 不 是 办 法 ， 而 叉 不 能 用 finish， 因 为 该 命令 正好 通过 
“未 来 的 代码 ”， 并 将 我 们 币 出 函数 。 在 这 种 情况 下 可 以 在 未 来 代码 处 设置 一 个 临时 汤 点 并 使 用 
continue。 这 恰好 是 until 要 来 处 理 的 情况 。 

使 用 until 会 执行 循环 的 其 余部 分 ， 让 GDB 在 循环 后 面 的 第 一 行 代码 处 暂停 。 图 2-12 显 示 了 
使 用 unti1 的 情况 。 

















...previous code... 


int i - 9999; 
while (i--) { 


printf("i is %d\n", i); 
.. -lots of code... 


} 


.. suture code... 





图 2-12 until 将 我 们 带 到 源 代码 当前 循环 体外 的 下 一 行 


当然 ， 如 果 GDB 在 离开 循环 前 遇 到 一 个 断 点 ， 它 融会 在 那里 暂停 : 如 果 图 2-12 中 的 printf() 
语句 处 有 一 个 断 点 ， 当 然 要 茶 用 该 断 点 。 

GDB 使 用 手册 给 出 了 until 的 官方 定义 : 执行 程序 ， 直 到 到 达 当 前 循环 体外 的 下 一 行 源 代 
码 。 

然而 ， 访 文档 还 警告 ， 这 可 能 有 点 违反 直觉 。 为 了 说 明 原 因 ， 来 看 代码 清单 2-2。 




















代码 清单 2-2  until-anomaly.c 


#include <stdio.h> 


int main(void) 


t 


int i; 


for (i=0; i<10; ++i) 
printf("hello world!"); 


return 0; 


} 
我 们 将 在 main() 的 入 口 处 设置 断 点 ， 运 行程 序 ， 并 使 用 until 来 到 达 return 语 句 。 





$ gdb until-anomaly 

Using host libthread db library "/lib/tls/libthread db.so.1". 
(gdb) break main 

Breakpoint 1 at 0x80483b4: file until-anomaly.c, line 7. 
(gdb) run 

Starting program: until-anomaly 


Breakpoint 1, main () at until-anomaly.c:7 


7 for (i-0; i«10; ++i) 

(gdb) until 

8 printf("hello world!"); 
(gdb) until 

7 for (i-0; i«10; ++i) 

(gdb) until 

10 return 0; 

(gdb) 








Aya th, fiHjuntilgs, GDBAS74T2K 8028811. AJ HEET. ERIC LEN 
中 的 第 7 行 比 第 8 行 靠 后 吗 ? 实际 上 ， 底 层 确 实 如 此 。 现 在 也 许 已 经 可 以 猜 到 答案 ， 因 为 这 似乎 是 
一 个 常见 的 主题 。GDB 最 终 使 用 的 是 机 器 指令 。 虽 然 for 结 构 编写 为 在 主体 上 方 进行 循环 测试 ， 
但 是 GCC 是 使 用 循环 主体 奔 部 的 条 件 编 译 程序 的 。 因 为 该 条 件 与 源 代码 的 第 7 行 天 联 ， 所 以 GDB 
似乎 在 源 代码 中 反问 执行 了 。 事 实 上 ，until 实 际 上 做 的 是 执行 程序 ， 直 到 它 到 达 内 存 地 址 比 当 
前 内 存 地 址 更 高 的 机 器 指令 ， 而 不 是 直到 a 到 达 源 代 公 中 一 个 更 大 的 行 号 。 

在 实践 中 ， 这 种 情况 可 能 不 是 经 常 出 现 , 但 是 了 解 它 何 时 会 出 现 是 不 错 的 。 为 外 ， 通 过 查看 
GDB 的 一 些 奇 怪 的 行为 , 可 以 收集 关于 编译 器 如 何 将 源 代码 转换 成 机 器 指令 的 信息 (知道 一 点 这 
方面 的 知识 没有 坏处 )。 

如 果 你 比较 好 奇 ， 而 且 异 得 机 器 的 汇编 语言 ， 则 可 以 使 用 GDB 的 disassemble 命 令 ， 后面 跟 
着 p/x $pc 来 输出 当前 位 置 。? 这 样 可 以 显示 until 将 做 的 事情 。 但 是 这 只 是 一 种 特殊 的 情况 ， 在 















































CD 也 可 以 使 用 GCC 的 -s 选 项 来 查看 机 右 人 码 。 使 用 该 选项 会 产生 一 个 后 级 为 .s 的 汇编 语言 文件 , 其 中 显示 了 编译 器 产 
生 的 代码 。 注 意 ， 这 样 只 会 产生 汇编 语言 文件 ， 而 不 能 产生 可 执行 文件 。 
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实际 应 用 中 这 不 是 问题 。 如 末 在 循环 的 末尾 ， 执 行 until 命 令 寻 致 回 跳 到 循环 顶部， 这 时 上 只 要 再 
次 执行 until， 驶 可 以 离开 当前 的 循环 。 

unti1 命 令 也 可 以 接受 源 代 但 中 的 位 置 作为 参数 。 事 实 上 ， 该 命令 接受 的 参数 与 2.4.1 节 讨论 
的 break 命 令 相 同 。 回 到 代码 清单 2-1 中 ， 如 果 GDB 触 发 了 main() 入 口 处 的 一 个 断 点 ， 那 么 可 以 使 
用 下 面 这 些 命令 方便 地 使 程序 一 直 执 行 到 swap() 的 入 口 。 

Q until 17 











Q until swap 
Q until swapflaw.c:17 


Q until swapflaw.c:swap 
2.9.2 在 DDD 中 


本 方 首 先 讨 论 在 断 点 处 暂停 了 DDD 后 恢复 执行 的 各 种 方式 。 

1. 标准 操作 

DDD 的 命令 工 其 中 对 应 于 next 和 step 的 按钮 都 有 。 男 外 ， 可 以 分 别 使 用 FS 和 F6 功 能 键 执 行 
step 和 next。 

如 末 要 在 DDD 中 使 用 市 参数 的 next 或 step， 即 通过 如 下 代码 在 GDB 中 完成 要 做 的 事 。 


(gdb) next 3 


那么 需要 在 DDD 的 控制 台 窗 口中 使 用 GDB 本 号。 

DDD 的 命令 工具 中 有 一 个 对 应 于 continue 的 按钮 ， 但 是 同样 地 ， 如 果 要 执行 带 参 数 的 
continue， 需 使 用 GDB 控 制 合 。 可 以 单 击 源 窗口 来 打开 continue until here 选 项 ， 这 样 可 以 真正 在 
源 代码 的 那 一 行 处 设置 临时 断 点 〈《 见 2.4.1 广 )。 更 精确 地 说 ，continue until heres kE *— AA 
执行 到 这 一 点 ， 但 是 在 任何 中 间断 点 处 也 集 止 ”。 

在 GDB 中 , 通过 带 数 值 参数 的 next 可 以 获得 与 finish 相 同 的 效果 ， 只 是 finish 或 多 或 少 地 方便 
一 些 。 但 是 在 DDD 中 ， 使 用 finish 是 相当 明智 的 ， 因 为 这 样 只 要 在 命令 工具 中 单 击 一 次 鼠标 即 可 。 

如 果 使 用 的 是 DDD， 则 可 以 使 用 名 为 Until on the Command Tool 的 按钮 来 执行 unti1L， 或 者 单 
击 Program 一 Until 深 单 栏 ， 也 可 以 使 用 键盘 快捷 键 F7。 在 所 有 这 些 选项 中 ， 总 会 发 现 一 种 方便 的 
方法 ! 与 其 他 很 多 GDB 命 令 一 样 ， 如 果 要 使 用 市 参数 的 until1， 只 需要 在 DDD 控 制 台 窗 口中 直接 
使 用 GDB 命 令 。 

2. Undo/Redo 

正如 2.7.6 节 介绍 的 ， DDD 有 一 个 非常 有 用 的 Undo/Redo 功 能 。 在 那 一 节 中 ， 我 们 介绍 了 如 何 
撤销 不 小 心 的 断 点 删除 。 这 种 方法 也 可 以 用 于 Run、Next、Step 等 动作 。 

例如 ， 来 看 图 2-13 描 述 的 情况 。 我 们 在 调用 swap() 时 到 达 了 断 点 ， 打 算 执 行 一 个 Step 操 作 ， 
但 是 不 小 心 持 击 了 Next 按 钮 。 直 到 这 种 情况 ， 只 要 单 击 Undo， 束 可 以 将 时 间 倒 退回 去 ， 如 图 2-14 
所 示 。 DDD 将 当前 行 的 光标 显示 为 轮廓 而 不 是 它 一 般 使 用 的 实心 绿色 ,从 而 提醒 你 撤销 了 茶 些 操 
Wes 
























































iw DDD: /root/Debug/main.c 


" s it (33 72 a ^ BR 
main. c:14 fo gd a2 pee he ON 
Finskas TC RAUTEE HIO BIOL 


#include <stdio.h> 
void swapCint *a, int *b); 


in main(void) 


int i = 3; 
int J =5; 
printFC" 1s Sd. is: wdXn*, 1. 13: 


Qiswap(&i, aj); 
Printhe- is xd. 3e edn. 15 32 





return 0; 


1s 5325 3$ 5 


Breakpoint 4, main () at main.c:10 
(gdb) next 
(gdb) T 





图 2-13 不 小 心 按 了 Next 按 钮 


iw DDD: /root/Debug/main.c 


ý ND it 5 PE 72 F jx GA > m tX 
main.c:14 v s Pd oe i AES I "4 f oy XD 
Pati PF WATCH, PANTENE SY PIOL SHOW OTs Ser Une ey 


#include <stdio.h> 
void swapCint *a, int *b); 
int main(void) 


int i = 3; 

int j = 5; 
rn en le Md, de Sin". T, 33s 
Swap (ai, &j); 

printfC"i: $d, j: *d\n", i, 3); 


return 0; 


1535 Je S 


Breakpoint 4, main () at main.c:10 
(gdb) next 
(gdb) ; 


^ 





Kl2-14 ” 单 击 Undo 撤 销 上 一 个 操作 
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2.9.3 在 Eclipse 中 


Eclipse 中 对 应 于 step 和 next 命 令 的 是 Step Into 和 Step Over 图 标 。Step Into 图 标 在 图 2-15 所 示 的 
Debug 视 网 中 是 可 见 的 〈 左 上方)， 鼠 标 指针 位 置 临时 导致 了 图 标 标签 的 出 现 。Step Over 图 标 就 
年 它 右边 。 注 意 ， 将 要 执行 的 下 一 个 语句 是 对 get_args() 的 调用 ， 因 此 单 击 Step Into 会 导致 程序 
执行 的 下 次 和 暂 俘 发 生 在 该 国 数 的 第 一 个 语句 中 ， 而 选择 Step Over 意味 看 下 次 暂 俘 将 在 对 
process data() 的 调用 中 。 














Eile Edit Refactor- Navigate Search Project Run Window Help 
|æ D |$ O- Q- |e |e 
$ Debug EN. 
ke b> aw (ajo «= i 
v [Elinsert_sort Debug [C/C++ Local Ap|Step Into] 
'v È gdb/mi (12/16/07 7:55 PM) (Suspended) 
Y if? Thread [0] (Suspended) 
= 1 main0 /workspace/insert_sort/ins.c:63 0x08048524 
ell gdb (12/16/07 7:55 PM) 
vl /workspace/insert sort/Debug/insert sort (12/16/07 7:55 PM) 

















{9 ins.c X 


M —À——————————— 
for (i = 0; i « num inputs; i++) OW ow 


e ~ 
à printf("%d\n" ,v[1]); 
) 





€ x.:int[] 
€ y.:int[] 


? ( get args(argc,argv); 6 num inputs : int 


process. data(); 
print. results(); 


int main(int argc, char ** argv) 


€ num y: int 
49 get args(int, char) : void 


9 scoot over(int) : void 














B Console 23 ` £i Tasks | E Problems | G Memory | 


insert_sort Debug [C/C++ Local Application] /workspace/insert_sort/Debug/insert_sort (12/16/07 7:55 PM) 
then: then/endif not found. 














K|2-15 Eclipse 中 的 Step Into 图 标 


Eclipse 有 一 个 执行 finish 的 Step Return lbs (ZEStep Over) 。 它 与 until 的 功能 完全 不 一 
FF. fEEclipse'F38 7$ fii H] Run to Line 〈 通 过 单 击 目标 行 然后 在 源 代 但 窗口 中 右 击 来 调用 ) 来 完成 
希望 使 用 until 完 成 的 事 。 


2.10 条 件 断 点 


上 只 要 司 用 了 断 点 ， 调 试 豆 融 总 是 在 该 断 点 处 停止 。 然 而 ， 有 时 有 必要 告诉 调试 毅 上 只 有 当 符 合 
东 种 条 件 时 才 在 断 点 处 停 上 ， 比 如 当 变 量具 有 我 们 感 兴趣 的 东 个 特定 的 值 时 。 

这 类 似 于 监视 后 的 工作 方式 , 但 是 有 一 个 重要 区 别 。 如果 怀疑 条 个 变量 在 攻 处 得 到 了 一 个 伪 
值 ， 那 么 条 件 断 点 比 监 视点 更 利于 作 判 断 。 每 当 该 变量 的 值 发 生变 化 时 ， 监 视点 都 会 中 断 。 条 件 
靳 点 只 会 在 怀疑 有 问题 的 代码 处 当 变 量 呈 现 该 怀疑 值 时 才 中 断 。 从 这 个 意义 上 讲 ， 当 完全 不 知道 
变量 在 何 处 接受 了 伪 值 时 ， 最 好 使 用 监视 点 。 这 对 于 全 局 变量 或 者 在 函数 之 间 连 续 传 递 的 局 部 变 
量 来 说 特别 有 用 。 但 是 在 其 他 大 多 数 情况 下 ， 位 置 放 得 较 好 的 条 件 断 点 则 更 有 用 、 喝 方便 。 
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2.10.1 GDB 

设置 条 件 断 点 的 语法 为 : 

break break-args if (condition) 

其 中 preak-args 是 可 以 传递 给 break 以 指定 汤 点 位 置 的 任何 参数 (如 2.4.1 节 所 讨论 的 )， 
condition 是 2.12.2 节 定义 的 布尔 表达 式 。 插 着 condition 的 圆 括号 是 可 选 的 。 圆 括 号 会 使 一 些 C 
程序 员 有 宾至如归 的 感觉 ， 但 是 你 也 可 能 喜欢 更 整洁 的 外 观 。 

例如 ， 下 面 说 明了 如 果 用 户 向 程序 中 键入 一 些 命 令 行 参 数 ， 如 何在 main() 处 中 断 ”: 























break main if argc > 1 


ATE PARA OR TR S| See FS ETA SDA A AA PAN FEST: 


for (i=0; i«-75000; ++i) { 
retval = process(i); 
do something(retval); 


} 


假设 你 知道 当 i 为 70 000 时 程序 会 陷入 混乱 ， 要 在 循环 顶部 中 断 ， 但 是 不 打算 用 next 通 过 
69 999 次 迭代 。 这 时 就 非常 适合 使 用 条 件 中 断 。 可 以 在 循环 顶部 设置 一 个 断 点 ， 但 是 只 有 当 i 等 
于 70 000 时 才 中 断 ， 代 码 如 下 。 


break if (i -- 70000) 


当然 ， 可 以 通过 键入 continue 69999 来 获得 相同 的 效果 ， 只 是 这 样 不 大 方便 。 

条 件 中 断 也 极其 灵活 ， 不 仅 可 以 测试 相等 或 不 相等 的 变量 。 在 condition 中 可 以 使 用 哪些 表 
XXE? 在 有 效 的 C 条 件 语 句 中 几乎 可 以 使 用 任何 表达 式 。 无 论 使 用 什么 表达 式 ， 都 需要 具有 布 
尔 值 ， 即 真 〈 非 0) 或 假 COD 。 包 丘 : 

O 相等 、 逻 辑 和 不 相等 运算 符 《<、<=、==、!=、>、>=、&&、| | 等 ) ， 例 如 : 


break 180 if string--NULL 8& i < O 






































a 按 位 和 移 位 运算 符 CR. |. ^.» ««580, Pd: 
break test.c:34 if (x & y) == 1 
Q 算术 运算 符 (+、 -. X4 /、 26); 例如 : 


break myfunc if i % (j + 3) != 0 
QD 假设 声明 了 argc 和 argv 作 为 main() 的 参数 。〔 当 然 ， 如 果 使 用 不 同 的 名 称 声明 了 它们 ， 比 如 ac 和 av， 那 么 就 使 


用 所 声明 的 名 称 。》 顺 便 提 一 下 ， 注 意 程序 总 是 人 至少 接 受 一 个 参数 (通过 argv[8] 指 定 的 程序 本 里 的 名 称 ， 我 们 
这 里 没有 将 它 算 作 “ 用 户 参 数 ”) 。 
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a 你 自己 的 函数 ， 只 要 它们 被 链接 到 程序 中 ， 例 如 : 
break test.c:myfunc if ! check variable sanity(i) 
O 库 函 数 ， 只 要 该 库 被 链接 到 代码 中 ， 例 如 : 
break 44 if strlen(mystring) -- 0 


由 于 优先 级 的 次 序 规则 在 起 作用 ， 因 此 可 能 需要 使 用 圆 括 号 将 一 些 结构 括 起 来 ， 比 如 : 














(x & y) == 0 
此 外 ， 如 采 在 GDB 表 达 式 中 使 用 库 函 数 ， 而 该 库 不 是 用 调试 从 写 编 详 的 ( 儿 乎 肯定 是 这 种 情 
况 ) ， 那 么 唯一 能 在 断 点 条 件 中 使 用 的 返回 值 类 型 为 int。 换 谨 之 ， 如 果 没 有 调试 信息 ，GDB 会 





假设 函数 的 返回 值 是 int 类 型 。 当 这 种 假设 不 正确 时 ， 孙 数 的 返回 值 会 被 曲解 。 


(gdb) print cos(0.0) 
$1 - 14368 


然而 ， 类 型 强制 转换 也 无 济 于 事 。 


(gdb) print (double) cos(0.0) 
$2 - 14336 


如 果 三 角 数 学 知识 还 没 态 的 话 ， 就 会 知道 0 的 余弦 是 1。 














使 用 非 int 返 回 函 数 
实际 上 , 有 一 种 方式 可 以 在 GDB 表 达 式 中 使 用 不 返回 int 的 函数 , 但 是 这 种 方式 相当 神秘 。 
技巧 在 于 应 使 用 指向 函数 的 恰当 数据 类 型 定义 一 个 便于 GDB 使 用 的 变量 。 
(gdb) set $p = (double (*) (double)) cos 


(gdb) ptype $p 
type = double (*)() 
(gdb) p cos(3.14159265) 


$2 - 14368 
(gdb) p $p(3.14159265) 
$4 = -1 


如 果 你 的 三 角 数 学 知识 还 有 一 点 儿 ， 就 会 知道 3.14159265 是 nt 的 近似 值 ，A 的 余弦 为 -1。 


可 以 对 正常 断后 设置 条 件 将 它们 转变 为 条 件 断 后 。 例如， 如 末 设 置 了 断 点 3 作为 无 条 件 断 点 ， 
但 是 现在 希望 添加 条 件 i==3， 只 要 键入 : 





(gdb) cond 3 i == 3 


和 如果 以 后 要 删除 条 件 ， 但 是 保持 该 断后 ， 只 要 键入 : 


2.10 条 件 断 点 09 
(gdb) cond 3 


2.10.2 DDD 


在 DDD 中 设置 条 件 断 点 可 以 通过 在 控制 台 窗 口中 设置 GDB 语 义 来 实现 。 或 者 按 如 下 所 示 的 方 
式 使 用 DDD。 在 代码 中 希望 出 现 条 件 断 点 的 地 方 设置 正常 断 点 〈( 即 非 条 件 断 点 )。 右 击 并 按 下 红 
色 停 止 符号 来 打开 一 个 菜单 并 选择 Properties。 这 时 会 出 现 一 个 弹出 窗口 ， 有 一 个 名 为 Condition 的 
文本 入 口 杠 。 在 该 框 中 键入 条 件 ， 单 击 Apply 按 钮 ， 然 后 蛙 击 Close 按 钮 。 断 点 现在 束 是 条 件 断 点 。 

这 一 过 程 如 图 2-16 所 示 。 我 们 在 汤 点 4 上 看 到 了 条 件 j==@8。 顺 便 说 一 下 ， 那 一 行 代码 上 的 集 
止 符号 现在 会 包含 一 个 问号 ， 提 醒 我 们 这 是 条 件 中 断 。 

















bd DDD: Properties: Breakpoint 4 





图 2-16 在 DDD 中 对 断 点 施加 条 件 


2.10.3 Eclipse 


为 了 使 断 点 成 为 条 件 断 点 , 右 击 该 行 代码 的 断 点 符号 ,选择 Breakpoint Properties... Common, 
并 在 对 话 框 中 填充 条 件 。 该 对 话 框 如 图 2-17 所 示 。 


v Properties for C/C++ breakpoint 
type filter te 








Common 





Type: C/C++ line breakpoint 

File: /workspace/insert_sort/ins.c 
Line number. 52 

[v] Enabled 


Conon 
— 4 








图 2-17 在 Eclipse 中 对 断 点 施加 条 件 
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2.11 断 点 命令 列表 


当 GDB 遇 到 断 点 时 ， 儿 乎 总 是 要 奋 看 茶 个 变量 。 如 采 反 复 遇 到 同一 个 断 点 《与 循环 内 的 断 点 
一 样 ) ， 将 反复 但 看 相同 的 变量 。 让 GDB 在 每 次 到 达 示 个 断 氮 时 目 动 执行 一 组 命令 ， 从 而 目 动 完 
成 这 一 过 程 ， 不 是 很 好 吗 ? 

事实 上 ,使 用 “ 汤 点 命令 列表 ” 束 可 以 做 这 件 事 。 我 们 将 使 用 GDB 的 printf 命 令 来 说 明 命 令 
列表 。 虽 然 本 书 还 没有 正式 介绍 printf， 但 是 它 在 GDB 中 的 工作 方式 与 在 C 中 基本 相同 ， 上 只 有 是 
FS we PY RELY 
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commands breakpoint-number 



































=] 


commands 
end 


其 中 breahpoint-number 是 要 将 命令 添加 到 其 上 的 断 点 的 标识 符 ，commands 是 每 行 一 个 有 效 
GDB 命 令 的 列表 。 逐 条 输入 命令 ， 然 后 键入 end 表 示 输 入 命令 完毕 。 从 那 以 后 ， 每 当 GDB 在 这 个 
断 点 处 中 断 时 ， 它 都 会 执行 你 输入 的 任何 命令 。 让 我 们 看 一 个 示例 ， 见 代码 清单 2-3。 


代码 清单 2-3 fibonacci.c 





#include «stdio.h» 
int fibonacci(int n); 


int main(void) 
{ 
printf("Fibonacci(3) is %d.\n", fibonacci(3)); 


return 0; 


} 


int fibonacci(int n) 
i 
Lfd m «em oss x) 
return 1; 
else 
return fibonacci(n-1) + fibonacci(n-2); 


} 


我 们 打算 碍 看 传递 给 fibonacci() 的 值 及 其 次 序 。 然 而 ， 你 不 想 在 程序 中 插入 printf() 语 句 并 
重新 编 详 代 人 码 。 在 关于 调试 的 书 中 这 样 做 很 特 抽 ， 是 吧 ? 更 要 命 的 是 ， 插 入 代 公 并 重新 编 详 /连接 
需要 花 时 间 , 修复 了 这 个 特定 程序 错误 后 再 去 掉 该 代码 也 需要 花 时 间 , 尤其 是 当 程 序 比 较 大 时 更 是 
如 此 。 而 且 ， 与 代码 无 天 的 语句 会 使 代码 混乱 ， 因 此 这 样 使 得 在 调试 期 间 代 码 难 以 阅读 。 
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可 以 使 用 step 单 步调 试 代 码 ， 并 在 每 次 调用 fibonacci() 时 输出 n， 但 是 使 用 命令 列表 更 好 ， 
因为 这 样 束 不 圾 要 重复 键入 输出 命令 。 让 我 们 看 一 下 。 

站 先 ， 在 fibonacci() 最 上 方 设 置 一 个 断 点 。 这 个 断 点 将 被 指定 为 标识 符 1， 因 为 它 是 设置 的 
第 一 个 断 点 。 然 后 在 断 点 1 上 设置 一 个 输出 变量 n 的 命令 。 


$ gdb fibonacci 

(gdb) break fibonacci 

Breakpoint 1 at 0x80483e0: file fibonacci.c, line 13. 
(gdb) commands 1 


Tune cammande far whan hreab 
yr} he LCA NA O3 IL Cidg LT g] [和 














poin 
End with a line saying just "end". 
»printf "fibonacci was passed %d.\n", n 
»end 


(gdb) 
现在 运行 程序 ， 并 查看 发 生 了 什么 事情 。 


(gdb) run 
Starting program: fibonacci 











Breakpoint 1, fibonacci (n-3) at fibonacci.c:13 
13 if (n<=0 || n--1) 
fibonacci was passed 3. 

(gdb) continue 

Continuing. 


Breakpoint 1, fibonacci (n-2) at fibonacci.c:13 
13 if (n<=0 || n==1) 
fihanarceri wac maccond 9 

LUMA WAD | wh aoa 
(gdb) continue 
Continuing. 


Breakpoint 1, fibonacci (n-1) at fibonacci. 
13 if (n«»0 || n=1) 
fibonacci was passed 1. 

(gdb) continue 

Continuing. 


e 


: 13 


Breakpoint 1, fibonacci (n=0) at fibonacci.c:13 
13 if (n<=0 || n==1) 
fibonacci was passed O. 

(gdb) continue 

Continuing. 


Breakpoint 1, fibonacci (n-1) at fibonacci.c:13 
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13 | 人 
fibonacci was passed 1. 

(gdb) continue 

Continuing. 

Fibonacci(3) is 3. 


Program exited normally. 
(gdb) 


AR WROTE, Att AUK. Hee, RANGA Seth. Brae, FAY 
使 用 silent 命 令 〈 它 需要 是 命令 列表 中 的 第 一 个 命令 ) 使 GDB 更 安静 地 触及 断 点 。 让 我 们 看 一 下 
silent 的 实际 应 用 。 注 意 我 们 如 何 通 过 将 新 命令 列表 放 在 我 们 原来 设置 的 命令 列表 “上 面 ” KE 
新 定义 命令 列表 。 


(gdb) commands 1 
Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 


POLLO 


»printf "fibonacci was passed %d.\n", n 
»end 
(gdb) 


输出 如 下 所 示 。 


(gdb) run 

Starting program: fibonacci 
fibonacci was passed 3. 
(gdb) continue 

Continuing. 

fibonacci was passed 2. 
(gdb) continue 

Continuing. 


£ihanarra LFT pe E a nacca 
i1DOndCcCi Was pd55c 


(gdb) continue 
Continuing. 

fibonacci was passed O. 
(gdb) continue 
Continuing. 

fibonacci was passed 1. 
(gdb) continue 
Continuing. 
Fibonacci(3) is 3. 


I2 


Program exited normally. 
(gdb) 
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现在 的 输出 结果 不 错 。 要 介绍 的 最 后 一 个 功能 是 : 如 果 命 令 列 表 中 的 最 后 一 个 命令 是 
continue，GDB 将 在 完成 命令 列表 中 的 命令 后 继续 目 动 执行 程序 。 


(gdb) command 1 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>silent 

»printf "fibonacci was passed %d.\n", n 

»continue 

»end 

(gdb) run 

Starting program: fibonacci 

fibonacci was passed 3. 





fibonacci was passed 2. 
fibonacci was passed 1. 
fibonacci was passed 0. 
fibonacci was passed 1. 
Fibonacci(3) is 3. 


Program exited normally. 
(gdb) 


你 可 能 要 在 其 他 程序 或 者 该 程序 的 其 他 代码 行 中 做 这 种 类 型 的 事情 ， 因 此 让 我 们 顺势 使 用 
GDB 的 define 命 令 创建 安 。 
首先 ， 让 我 们 定义 宏 ， 命 名 为 print_and_go。 


(gdb) define print and go 

Redefine command "print and go"? (y or n) y 
Type commands for definition of "print and go". 
End with a line saying just "end". 

>printf $argO, $argi 

»continue 

»end 


BEAR EIR GABE TE IAT Ze BEA: 


(gdb) commands 1 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>silent 

»print and go "fibonacci() was passed %d\n" n 

»end 


HEX, print and golf] S7 RAL S. Wea AITE, TES] DAA TRIES Ar dh 
1H de f Ab ZEILE n] ELT Hn BS TER 7; ERE ISCTE « Mu Ho. TELE DRE. gdbinit AFP, TET 
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其 他 程序 使 用 。 顺 便 说 一 下 ， 尽 管 这 个 示例 中 只 有 2 个 参数 ， 但 最 多 允许 有 10 个 参数 。 
PEA show user 可 以 列 出 所 有 安 。 
尽管 命令 列表 非常 有 用 ， 但 是 将 它们 与 条 件 中 断 合并 后 ， 将 其 SEEN MIB e 使 用 这 种 条 件 
输入 /输出 ， 甚 至 可 以 试 着 抛 掉 C 语 言 ， 只 使 用 GDB 作 为 所 选择 的 编程 语言 。 当 然 ， 这 只 是 开 个 玩 


AY 


天 。 




















命令 与 表达 式 
实际 上 ，2.12.2 节 列 出 的 任何 有 效 GDB 表 达 式 都 可 以 进入 命令 列表 。 可 以 使 用 库 涵 数 ， 其 
至 你 自己 的 函数 ， 只 要 它们 被 连接 到 执行 文件 中 即 可 。 可 以 使 用 它们 的 返回 值 ， 只 要 它 全 
的 值 为 int 类 型 。 例 如 : 


(gdb) command 2 

Type commands for when breakpoint 2 is hit, one per line. 
End with a line saying just "end". 

»silent 

»printf "string has a length of %d\n", strlen(string) 
»end 








DDD FHS RAWSDDD PHATE. Hoc. WHA. Aare Ikea S. FP 
择 Properties。 这 时 会 出 现 一 个 弹出 窗口 。 右 边 会 有 一 个 大 的 子 窗口 〈 如 采 看 不 到 这 个 大 子 窗口 ， 
单 击 Edit 按 钮 ， 会 使 命令 窗口 出 现 ) 。 可 以 将 命令 都 键入 到 这 个 窗口 中 。 还 有 一 个 Record 按 饵 ， 
右 击 这 个 按钮 ， 可 以 将 命令 输入 GDB 控 制 台 中 。 

Eclipse 似乎 没有 命令 列表 功能 


2.12 EST ER 
监视 点 是 一 种 特殊 类 型 的 断 点 ， 它 类 似 于 正常 断 点 ， 是 要 求 GDB 和 暂停 程序 执行 的 指令 。 区 


signis 扩 没 有 “ 住 在 ”对 一 行 源 代 人 码 中 ， 而 是 指示 GDB 每 当 作 个 表达 式 改变 了 值 束 暂 集 执 
“该 表达 式 可 以 非常 简单 ， 比 如 变量 的 名 称 : 


(gdb) watch i 
已 会 使 得 每 当 i 改 变 值 时 GDB 就 叔 俘 。 表 达 式 也 可 以 非常 复杂 。 
(gdb) watch (i | j > 12) 8& i > 24 8& strlen(name) > 6 


可 以 将 监视 点 看 做 被 “附加 ”在 表达 式 上 ， 当 表达 式 的 值 改变 时 ，GDB 会 暂 集 程序 的 执行 。 
虽然 党 理 监 视点 和 断 点 的 方式 相同 ,但 是 两 者 之 间 有 一 个 重要 区 别 。 断 操 与 源 代 人 码 中 的 一 个 
位 置 关 联 。 只 要 代码 没有 改变 ， 吏 不 存在 茶 行 代码 “超出 作用 域 ” 的 风险 。 因 为 C 语 言 有 严格 的 









































CD 表达 式 将 在 2.12.2 节 中 更 全 面 地 介绍 。 
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作用 域 规则 , 所 以 只 能 监视 存在 且 在 作用 域内 的 和 变量, 一旦 变量 不 再 存在 于 调用 栈 的 任何 帧 中 ( 当 
包含 局 部 变量 的 函数 返回 时 )，GDB 会 自动 删除 监视 点 。 

例如 2.5 贡 中 名 为 swapper 的 程序 。 在 这 个 程序 中 ， 将 局 部 变量 c 用 于 临时 存储 器 。 在 GDB 到 
达 定 义 了 c 的 swapperc 的 第 3 行 乙 本 ， 不 能 在 c 上 设置 监视 点 。 上 此外， 如果 在 c 上 设置 了 监视 点 ， 一 
旦 GDB 从 swapper() 返 回 ， 就 会 自动 删除 该 监视 点 ， 因 为 c 不 复 存在 。 

每 次 变量 改变 时 都 让 GDB 中 断 ， 对 于 被 循环 紧密 包 囊 的 代码 或 者 重复 代码 来 说 可 能 有 点 讨 
大 。 虽然 监视 点 昕 上 去 不 错 , 但 是 位 置 选 得 好 的 断 点 可 能 要 有 用 得 多 。 然 而 ， 如 果 你 的 一 个 变量 
修改 了 ， 特 别 是 全 局 变量 ， 而 你 义 不 知 道 它 是 在 哪里 为 什么 发 生 了 改变 ， 则 监视 点 束 是 无 价 的 。 
如 果 你 在 处 理 线程 代码 ， 监 视点 的 用 处 就 有 限 GDB 只 能 监视 单个 线程 中 的 变量 。 第 5 章 对 此 会 


进一步 介绍 。 
2.12.1 设置 监视 点 
当 变 量 var 存 在 且 在 作用 域 中 时 ， 可 以 通过 使 用 如 下 命令 来 设置 监视 点 。 





















































watch var 


该 命令 会 导致 每 当 var 改 变 值 时 GDB 都 中 断 。 很 多 人 因此 而 喜欢 监视 点 ， 党 得 它 简 单方 便 。 然 而 ， 
还 有 一 蔡 情况 要 说 明 。GDB 实 际 上 有 是 在 var 的 内 存 位 置 改 变 值 时 中 断 。 一 般 情 况 下 ， 是 合 使 用 监 
视点 监视 变量 或 变量 的 地 址 并 没有 关系 , 但 是 在 特殊 情况 下 这 一 点 可 能 很 重要 ， 比 如 当 人 处 理 指 问 
站 针 的 指针 时 。 

















硬件 监视 点 
当 设 置 监 视点 时 ， 可 以 看 到 一 条 关于 “硬件 ”监视 点 的 消息 : 


(gdb) watch i 
Hardware watchpoint 2: i 


列 出 断 点 时 ， 同 样 也 能 看 到 类 似 的 消息 : 


(gdb) info breakpoints 
Num Type Disp Enb Address What 
2 hw watchpoint keep y i 


显然 ，2 是 指 监视 点 标识 符 ，i 是 指 被 监视 的 变量 ， 但 是 “硬件 ”监视 点 是 指 什么 呢 ? 

很 多 平台 都 有 实现 监视 点 的 专用 硬件 。 如 果 有 这 样 的 硬件 可 用 ，GDB 会 党 试 使 用 该 硬件 ， 
因为 使 用 硬件 实现 任何 操作 都 比较 快 。 

GDB 可 能 无 法 设置 硬件 监视 点 (该 平台 可 能 没有 必需 的 硬件 , 或 者 硬件 正 忙 于 别 的 事情 )。 
如 果 是 这 样 ，GDB 会 尝试 使 用 虚拟 内 存 技 术 实 现 监视 点 ， 这 也 很 快 。 

如 果 这 两 种 技术 都 不 可 用 ，GDB 会 通过 软件 实现 监视 点 本 身 ， 这 会 非常 非常 慢 。 

CPU 只 能 实现 有 限 数量 的 硬件 辅助 中 断 ， 包 括 监视 点 和 硬件 辅助 断 点 。 虽 然 这 个 数量 与 架 
构 有 关 ， 但 是 如 果 超 出 了 这 个 限制 ，GDB 就 会 输出 如 下 消息 。 





76 


AR 


四 


2% 1 FRAME 


Stopped; cannot insert breakpoints. 
You may have requested too many hardware breakpoints and watchpoints. 


如 果 看 到 这 条 消息 ， 就 应 该 删除 或 系 用 部 分 监视 点 或 硬件 辅助 断 点 。 





让 我 们 看 一 个 监视 点 非 第 有 用 的 示例 场景 。 假 设 有 两 个 int 变 量 x 和 y， 在 代码 中 的 人 条 一 处 执 
行 p=&y， 而 你 的 意 网 是 执行 p=&x。 这 可 能 会 导致 y 在 代码 中 共处 神秘 地 改变 了 值 。 导 致 程序 错误 




















的 实际 位 置 可 能 隐 韦 得 很 好 ， 因 此 断 点 的 用 处 不 会 太 大 。 然 而 ， 通 过 设置 监视 点 ， 可 以 立刻 知道 
y 在 何 时 何 处 值 发 生 了 变化 。 

监视 点 的 好 处 甚至 还 不 止 这些 , 它 不 仅仅 限于 监视 变量 。 事 实 上 , 还 可 以 监视 变量 的 表达 式 。 
每 当 表 达 式 修改 值 时 ，GDB 都 会 中 断 。 作 为 一 个 示例 ， 来 看 如 下 代码 。 


] 


2 


3 


4 


#include <stdio.h> 


int i = 0; 


int main(void) 


{ 


} 


i= 33 
| tL Lo OW VM 3 Tj 
i= 5; 


printf("i is %d.\n", i); 


return 0; 








我 们 想 在 每 当 i 大 于 4 时 得 到 通知 。 因 此 在 main() 的 入 口 处 放 一 个 断 点 ， 以 便 让 i 在 作用 域 中 ， 
并 设置 一 个 监视 点 以 指出 i 何 时 大 于 4。 不 能 在 i 上 设置 监视 点 ， 因 为 在 程序 运行 之 前 ，i 不 存在 。 
因此 必须 先 在 main() 上 设置 断 点 ， 然后 在 i 上 设置 监视 点 。 








(gdb) break main 

Breakpoint 1 at 0x80483b4: file test2.c, line 6. 
(gdb) run 

Starting program: test2 


Breakpoint 1, main () at test2.c:6 











既然 i 已 经 在 作用 域 中 了 ， 现 在 设置 监视 点 并 通知 GDB 继 续 执行 程序 。 我 们 完全 可 以 料 到 ， 
在 第 9 行 时 会 出 现 i>4 的 情况 。 


1 


Pi 


(gdb) watch i» 4 

Hardware watchpoint 2: i> 4 
(gdb) continue 

Continuing. 
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Hardware watchpoint 2: i» 4 
Old value - O 


s New value = 1 
» main () at test2.c:10 
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可 以 使 用 这 种 方法 在 控制 台 窗 口中 设置 监视 点 ， 然 而 ， 你 可 能 发 现 使 用 GUI 接口 更 方便 。 在 
源 窗口 中 ,找到 要 在 其 上 设置 监视 点 的 变量 。 这 个 位 置 不 必 是 变量 第 一 次 出 现 的 地 方 ， 可 以 是 它 
在 源 代码 中 出 现 的 任 一 处 。 单 击 该 变量 以 突出 显示 它 ， 然 后 单 击 采 蛙 栏 图 标 中 的 监视 点 特写。 监 
视点 的 设置 不 会 有 像 断 点 的 红色 停止 从 号 那样 的 标记 。 为 了 但 看 设置 的 监视 点 ， 必 须 按 2.3.2 节 介 
绍 的 方法 实际 列 出 所 有 汤 点 。 

在 Eclipse 中 设置 监视 点 的 方法 如 下 : 在 源 代码 窗口 中 右 击 ， 选 择 Add a Watch Expression, 2^ 
后 在 对 话 框 中 填写 所 需 表 达 式 。 


2.12.2 ”表达 式 


前 面 我 们 介绍 了 通过 GDB 的 watch 命 令 使 用 表达 式 (expression〉 的 一 个 示例 。 该 示例 表明 ， 
有 相当 多 的 GDB 命 令 〈 比 如 print) 也 接受 表达 式 参 数 。 因 此 ， 我 们 也 许 应 当 对 它们 多 进行 一 点 
儿 介绍 。 

GDB 中 的 表达 式 可 以 包含 很 多 内 容 : 

口 便于 GDB 使 用 的 变量 ; 

a 程序 中 的 任何 在 作用 域内 的 变量 ， 比 如 前 面 的 示例 中 的 i; 

a 任何 种 类 的 字符 串 、 数 值 或 学 从 沼 量 ; 

D 预 处 理 器 宏 〈( 如 果 程 序 被 编译 为 包括 预 处 理 器 调试 信息 ); 

a 条件、 函数 调用 、 类 型 强制 转换 和 上 所 用 语言 定义 的 运算 符 。 

因此 ， 如 果 在 调试 FORTRAN-77 程 序 ， 并 且 想 知道 变量 i 何 时 变 得 大 于 4， 不 需要 像 上 一 节 中 
那样 使 用 watch i>4， 而 是 可 以 使 用 watch i .GT. 4. 

虽然 在 很 多 教程 和 文档 中 常 将 C 语 法 用 于 GDB 表 达 式 ， 但 那 是 由 于 C 和 C++ 的 普遍 存在 的 性 
质 ; 如 果 使 用 的 是 C 语 言 以 外 的 语言 ，GDB 表 达 式 就 得 用 该 语言 的 元 素 中 构建 。 




































































CD 在 编写 本 书 时 ，GNU GDB 官 方 使 用 手册 指出 预 处 理 器 宏 不 能 用 在 表达 式 中 ， 然 而 情况 并 非 如 此 。 如 果 使 用 GCC 
的 -g3 选 项 编译 ， 丈 能 在 表达 式 中 使 用 预 处 理 占 宏 。 
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Pree 1 章 介 绍 过 ， 在 GDB 中 可 以 使 用 print 命 令 输出 变量 的 值 ， 在 DDD 和 Eclipse 中 可 以 通过 
Lr 将 鼠标 指针 移 到 源 代 码 中 任何 地 方 的 变量 的 实例 上 来 输出 变量 的 值 。 但 是 GDB 和 GUI 
者 提供 了 更 强大 的 检查 变量 和 数据 结构 的 方法 ， 这 是 本 章 将 重点 介绍 的 内 容 。 


3.1 主要 示例 代码 
F 面 是 二 又 树 的 一 种 直观 实现 (还 没有 顾及 到 效率 、 模 块 化 等 )。 








// bintree.c: 














routines to do insert and sorted print of a binary tree 


#include <stdio.h> 
#include <stdlib.h> 


struct node { 
int val; 
struct node 
struct node 


nh 
typedef struct 
nsp root; 


[E me 


{ 


nsp tmp; 


tmp = (nsp) 


tmp->val = x 


tmp->left = 
return tmp; 


} 


// stored value 
*left; // ptr to smaller child 
«right; // ptr to larger child 


node «nsp; 


nsp makenode(int x) 


malloc(sizeof(struct node)); 


tmp-»right - 0; 


void insert(nsp *btp, int x) 
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| 
nsp tmp = xbtp; 
if (wbtp == 0) { 
xbtp = makenode(x); 
return; 
} 
while (1) 
{ 
if (x < tmp->val) { 
if (tmp->left != 0) { 
tmp = tmp->left; 
} else { 
tmp-»left = makenode(x); 
break; 
J 
} else 1 
if (tmp-»right !- 0) ( 
tmp - tmp-»right; 
} else { 
tmp->right = makenode(x); 
break; 
} 
} 
} 
} 
void printtree(nsp bt) 
{ 
if (bt == 0) return; 
printtree(bt-»left); 
printf("%d\n" ,bt-»val); 
printtree(bt-»right); 
j 


int main(int argc, char xargv[]) 
t inti; 


root = 0; 
for (i = 1; i < argc; i++) 


insert(&root, atoi(argv[i])); 
printtree(root); 


j 


在 各 个 节点 上 ,， 左 子 树 的 所 有 元 素 都 小 于 给 定 节 点 中 的 值 ， 右 子 树 的 所 有 元 素 者 大 于 等 于 给 
定 市 点 中 的 值 。 函数 insert() 创 建 了 一 个 新 市 点 , 并 将 它 放 在 树 中 恰当 的 位 置 。 函数 printtree() 
按 数 字 升 序 显示 任意 子 树 的 元 素 ， 而 main() 运 行 一 个 测试 ， 输 出 整个 排序 后 的 数组 。™ 

对 于 这 里 的 调试 示例 , 假设 不 小 心 在 insert() 中 把 对 makenode() 进 行 第 二 次 调用 的 代码 错 写 
成 : 

tmp-»left = makenode(x); 
而 不 是 

tmp-»right = makenode(x); 
WRIST RR i Ye VEMM. S Eu «n. 


$ bintree 12 8 5 19 16 
16 
12 


让 我 们 探索 一 下 调试 工具 中 的 各 种 检查 命令 如 何 帮助 尽快 找到 程序 错误 。 
3.2 变量 的 高 级 检查 和 设置 

我 们 这 里 的 树 示例 复杂 性 更 高 ， 因 此 需要 更 局 级 的 方法 。 下 面 将 介绍 部 分 方法 。 
3.2.1 在 GDB 中 检查 


在 以 前 的 章节 中 使 用 过 GDB 的 基本 print 命 令 。 在 这 里 如 何 使 用 它 呢 ? 主要 工作 显然 是 在 
insert() 中 完成 , 因此 该 方法 将 是 一 个 好 的 起 始点 。 当 仍然 在 该 函数 的 wnile 循 环 中 运行 GDB 时 ， 
可 以 在 每 次 遇 到 断 点 时 执行 一 组 (3 个 ) GDB 命 令 。 





















































(gdb) p tmp-»val 

$1 - 12 

(gdb) p tmp-»left 

$2 = (struct node *) 0x8049698 
(gdb) p tmp->right 

$3 = (struct node *) 0x0 


EBRIETA, GDB MPI A$1. $255, HEB BASLER LAR RATE.. 
市 进一步 讨论 它们 。) 
在 这 里 将 发 现 ，tmp 当 前 指 问 的 节点 包含 12， 有 一 个 非 0 左 指针 ， 而 不 是 为 0 的 右 指 针 。 当 然 ， 











CD 顺便 说 一 下 , 注意 第 12 行 中 的 类 型 定义 nsp。 XX fV node struct pointer, 但 是 我 们 的 出 版 商 认为 它 是 No Starch Press。 
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左 指针 的 实际 值 ， 即 实际 内 存 地 址 ， 可 能 与 这 里 介绍 的 内 容 没 有 直接 关系 ， 但 是 指针 是 否 为 0 这 
一 事实 是 重要 的 。 关 键 是 这 里 目前 看 到 的 是 低 于 12 的 左 子 树 ， 而 不 是 右 子 树 。 

e 第 一 个 改进 : 输出 完整 的 结构 

每 次 到 达 一 个 断 点 时 都 要 键入 这 3 个 print 命 令 会 非常 费力 。 我 们 可 以 只 用 一 个 print 命 令 来 
完成 ， 用 法 如 下 。 


(gdb) p «tmp 
$4 = {val = 12, left = 0x8049698, right = 0x0} 


由 于 tmp 指 回访 结构 ， 因 此 *tmp 是 这 个 结构 本 身 ，GDB 癌 我 们 显示 了 完整 的 内 容 。 

@ 第 二 个 改进 : 使 用 GDB 的 display 命 令 

键入 上 面 的 p *tmp 能 节省 时 间 和 精力 。 每 次 遇 到 断 点 时 ， 只 需要 键入 一 个 GDB 命 令 ， 而 不 是 
3 个 。 但 是 ， 如 果 知 道 会 在 每 次 过 到 汤 点 时 都 键入 这 个 命令 ， 那么 使 用 GDB 的 display 命 令 ( 人 简写 
THp T fir 22K GDBFEBUT PRK AS CHT AR, 使 用 next 
或 step 命 令 等 ) 时 束 输 出 指定 条 月 

(gdb) disp *tmp 

1: «tmp = {val = 12, left = 0x8049698, right = 0x0} 


(gdb) c 
Continuing. 

















Breakpoint 1, insert (btp=0x804967c, x=5) at bintree.c:37 
37 if (x « tmp-»val) { 
1: «tmp = {val = 8, left = 0x0, right = 0x0} 


正如 在 这 里 所 见 的 ，GDB 在 遇 到 断 点 以 后 目 动 得 出 *tmp， 因 为 执行 了 display 命 令 。 

当然 ， 只 有 当 变 量 在 作用 域 中 时 ， 才 会 将 显示 列表 中 的 变量 显示 出 来 。 

e 第 三 个 改进 : 使 用 GDB 的 commands 命 令 

假设 希望 在 给 定 节 点 上 时 得 看 子 季 点 的 值 。 第 1 章 介 绍 过 GDB 的 commands 命 令 ， 可 以 按 如 下 
代码 使 用 。 


(gdb) b 37 
Breakpoint 1 at 0x8048403: file bintree.c, line 37. 
(gdb) commands 1 
Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 
»p tmp-»val 
»if (tmp-»left !- 0) 
>p tmp-»left-»val 
»else 
»printf "sWn", "none" 
»end 
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»if (tmp-»right != 0) 
»p tmp-»right-»val 
»else 
»printf "sWn", "none" 
»end 

»end 


注意 ， 在 这 个 示例 中 ，GDB 的 print 命 令 有 一 个 更 强大 的 相关 命令 
与 C 语 言 同 名 命令 相似 。 
下 面 是 得 到 的 GDB 会 话 的 采样 。 


Breakpoint 1, insert (btp-0x804967c, x-8) at bintree.c:37 
37 if (x « tmp-»val) 

$7 - 

none 

none 

(gdb) c 

Continuing. 














printf()， 它 的 格式 








Breakpoint 1, insert (btp-0x804967c, x=5) at bintree.c:37 
37 if (x « tmp-»val) 

$6 = 12 

$7 = 8 

none 

(gdb) c 

Continuing. 


Breakpoint 1, insert (btp=0x804967c, x=5) at bintree.c:37 
37 if (x < tmp-»val) 

$8 = 8 

none 

none 


当然 ， 使 用 标签 等 可 以 使 输出 更 易 读 。 

e 第 四 个 改进 : 使 用 GDB 的 call 命 令 

调试 中 的 一 个 弟 见 方法 是 隔离 出 现 问题 的 第 一 个 数据 项 。 在 这 个 例子 中 ， 可 以 通过 在 每 次 完 
成 对 insert() 的 调用 时 输出 整个 树 来 完成 这 件 事 。 由 于 无 论 如 何 源 文 件 中 都 有 一 个 函数 一 一 
printtree() 可 以 做 这 件 事 ， 因 此 可 以 简单 地 在 源 代 码 中 调用 insert() 之 后 马上 增加 对 这 个 函数 
的 调用 。 


insert(&root,atoi(argv[i])); 
printtree(root); 


LH - 
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然而 ， 从 各 种 角度 来 看 这 样 可 能 不 理想 。 比 如 ， 这 可 能 意味 看 必须 化 时 间 来 编辑 源 代 码 文件 
并 重新 编译 。 前 者 会 分 散 注意 力 ， 后 者 在 程序 比较 大 的 情况 下 比较 腕 时 间 。 毕 竞 ， 这 是 试图 通过 
使 用 调试 兰 避 免 的 事情 。 

相反 ， 从 GDB 中 做 这 件 事 就 比较 好 。 可 以 通过 GDB 的 cal1 命 令 做 这 件 事 。 例 如 ， 可 以 在 第 
5S7 行 〈 即 insert() 的 来 尾 ) 设置 一 个 断 点 ， 然 后 执行 如 下 代码 。 


(gdb) commands 2 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>print 征 “六 六 六 六 六 站 六 站 六 站 六 Current tree 六 六 六 六 六 六 六 六 站 六 站 

»call printtree(root) 

»end 


f SII GDBZ Hr P: 


Breakpoint 2, insert (btp-0x8049688, x-12) at bintree.c:57 
57 } 

Xobkxexekeke current tree 玉米 炒米 炒米 炒米 

12 

(gdb) c 

Continuing. 





Breakpoint 2, insert (btp=0x8049688, x-8) at bintree.c:57 
57 } 

foo current tree kk 

8 

12 

(gdb) c 

Continuing. 


Breakpoint 2, insert (btp-0x8049688, x-5) at bintree.c:57 
57 } 

ooo current tree 六 六 六 六 六 六 六 六 六 六 六 

5 

8 

12 

(gdb) c 


Continuing. 


Breakpoint 2, insert (btp=0x8049688, x=19) at bintree.c:57 
57 | 

coo: current tree 六 六 六 六 六 六 六 六 站 六 站 

19 

12 
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注意 ， 这 一 结果 表示 引起 问题 的 第 一 个 数据 项 是 19。 有 了 这 一 信息 可 以 很 快 直 接 瞄 准 程序 
彰 误 。 使 用 同样 的 数据 重新 运行 程序 ， 在 insert() 的 开头 设置 一 个 断 点 ,但 是 这 次 使 用 条 件 x == 


19， 然 后 研究 那里 发 生 了 什么 事情 。 





可 以 动态 地 修改 给 定 断 点 的 命令 集 ， 或 者 傈 单 地 通过 重新 定义 一 个 空 集合 来 取消 该 命令 集 。 


(gdb) commands 1 


Type commands for when breakpoint 1 is hit, one per line. 


End with a line saying just "end". 
»end 


3.22 ”在 DDD 中 检查 


现在 你 已 经 知道 ， 可 以 从 DDD 的 DDD 探 制 台 窗口 中 调用 任何 GDB 命 令 。 但 是 DDD 的 一 个 真 
正 的 优点 是 在 DDD 中 运行 很 多 GDB 命 令 更 方便 ， 在 有 些 情况 下 ，DDD 人 能够 执行 GDB 无 法 提供 的 
强 有 力 的 操作 ， 比 如 显示 下 面 描述 的 链接 数据 结构 。 

正如 前 面 儿 章 所 提 到 的 , 在 DDD 中 检查 变量 的 值 是 非常 方便 的 : 只 要 将 鼠标 指针 移 到 源 代码 
窗口 中 变量 的 任何 实例 上 。 但 是 还 有 其 他 很 多 方法 也 值得 使 用 ,尤其 是 对 于 使 用 链接 数据 结构 的 
程序 。 我 们 将 通过 使 用 本 章 前 面 的 二 又 树 示 例 来 说 明 。 














前 面 介 绍 过 GDB 的 display 命 令 : 
(gdb) disp *tmp 


这 里 , tmp 指 问 结构 的 内 容 在 每 次 过 
到 汤 点 时 目 动 输出 ， 否 则 会 导致 暂 停 执 
行程 序 。 由 于 tmp 是 指 癌 这 标 树 中 当前 节 
点 的 指针 ， 因 此 这 种 目 动 输出 有 助 于 监 
视 人 吉 历 这 标 树 时 的 进度 。 

DDD 中 对 应 的 功能 是 Display 命 令 。 
如 果 在 源 代 码 窗 口中 右 击 变量 的 任 一 实 
例 ， 比 如 本 例 中 的 root， 则 会 弹出 一 个 
图 3-1 所 示 的 菜单 。 可 以 看 到 ， 该 菜单 中 
有 一 些 关 于 查看 root 的 选项 。 选 项 Print 
root 和 Print *root 的 工作 方式 与 它们 的 
GDB 对 应 命令 完全 相同 ， 事 实 上 它们 的 
输出 出 现在 DDD 的 控制 台中 在 这 里 回 
显 / 输 入 GDB 命 令 )。 但 是 对 于 目前 的 情 
况 ， 最 有 趣 的 选项 是 Displaykroot 。 遇 
到 源 代 码 的 第 48 行 的 断 点 后 ， 选 择 该 选 
项 的 结果 如 图 3-2 所 示 。 
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} else { 
if (tmp-»right != 0) { 
tmp = —>right; 
} else { 
tmp-»right = makenode(x); 
break; 


void printtree(nsp bt) 


if (bt == 0) return; 
printtree(bt-»left); 
printf("%d\n",bt-—>val); 
printtree(bt-»right); 


int main(int argc, char *argv[]) 
E EnG y 


Ot argc; i++) 
t, atoicargv[i])); 
Dis 


19 16 i 
then: ES Sinot found. 
R Mert (btp=0x804972c, x=12) at bintree.c:57 


E 


图 3-1 ”查看 变量 的 弹出 窗口 


32 ”变量 的 高 级 检查 和 设置 85 


DDD /home/nm/Debug/Book/bintree.c 


) else { 


if (tmp-»right != 0) { 
tmp = tmp-»right;i 
} else { 
tmp—>right = makenode(x); 
break; 





void printtree(nsp bt) 


if (bt == 0) return; 
printtree(bt-»left); 
printfc"%d\n" ,bt->val); 
printtree(bt-»right); 





Breakpoint 1, insert (btp=0x804972c, x-12) at bintree.c:57 
(gdb) cont 


Breakpoint 1, insert (btp=0x804972c, x=8) at bintree.c:57 
(gdb) 











图 3-2 WS AES 


这 时 出 现 一 个 新 的 DDD 窗 口 一 一 数据 窗口 ， 其 中 的 节点 对 应 于 root。 到 目前 为 止 ， 这 个 命令 
无 非 只 是 像 图 形 化 的 GDB 的 display 命 令 。 但 是 这 里 真正 的 好 处 是 可 以 跟踪 树 链接 。 比 如 ， 要 跟 
踩 树 的 左 分 文 ， 只 要 右 击 显示 的 根 节 点 的 left 学 段 。( 这 时 不 要 对 right 玫 点 这 样 做 ， 因 为 链接 为 
0.0 然后 在 弹出 菜单 中 选择 Display *() 选 项 ， 现 在 DDD 如 图 3-3 所 示 。 因 此 ，DDD 呈 现 了 这 棵 树 
(或 者 树 的 一 部 分 ) 的 图 ， 束 像 在 黑板 上 男 出 来 的 一 样 ， 非 常 酪 ! 


DDD: /home/nm/Debug/Book/bintree-c 








root->left->left] 


} else { 


if (tmp-»right != 0) { 
tmp = tmp-»right; 

) else { 
tmp-»right = makenode(x) ; 
break; 


void printtree(nsp bt) 


TEC t—=:0) return; 
printtree(bt-»left); 
printfc"%d\n" ,bt->val); 
printtree(bt->right); 


(gdb) cont 


Breakpoint 1, insert (btp=0x804972c, x=8) at bintree.c:57 
(gdb) graph display *(root-»left) dependent on 1 
(gdb) 











K3-3 ”跟踪 链接 


J- 
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每 当 市 皮 内 容 改 变 时 ， 现 有 市 点 内 容 的 显示 会 目 动 更 狐 。 每 次 一 个 链接 从 0 改变 为 非 0O 时 ， 都 
可 以 右 击 它 以 显示 新 市 反 。 

显然 ,数据 窗口 很 快 会 变 得 混乱 。 你 可 以 通过 单 击 并 拖 动 该 窗口 右 下 方 的 小 方 框 来 展开 窗口 ， 
但 是 更 好 的 方法 是 在 局 动 DDD 前 惑 预 抑 到 这 种 情况 。 如 朱 用 separate 命 令 行 选项 调用 DDD: 























$ ddd --separate bintree 


那么 会 出 现 一 些 单 独 的 窗口 一 一 源 代 人 码 窗 口 、 控 制 台 窗口 和 数据 窗口 ， 这 些 窗口 的 大 小 都 可 以 重 
新 调整 。 

如 果 要 在 DDD 会 话 期 间 删 除数 据 窗口 的 部 分 或 全 部 内 容 , 有 很 多 方式 可 以 做 到 这 一 点 。 例 如 ， 
可 以 右 击 一 个 条 目 ， 然 后 选择 Undisplay 选 项 。 
3.2.3 ”在 Eclipse 中 检查 

与 DDD 一 样 ,要 在 Eclipse 中 检查 标 量变 量 ， 只 要 将 鼠标 指针 移 到 源 代 码 窗口 中 的 变量 的 任何 
实例 上 即 可 。 注 意 ， 这 必须 是 一 个 独立 的 标量 ， 而 不 是 在 struct 中 这 样 ， 如 图 3-4 中 所 示 。 这 里 
我 们 成 功 地 查询 了 x 的 值 , 但 要 是 将 鼠标 指针 指 问 同一 行 中 tmp->val 的 val 部 分 ， 就 不 会 显示 那里 
ATA. 
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ee Breakpoints [09= Variables $2 \ fif Registers, mA Modules. xil 
A $ o» B 2$. - E “ae ¥ k 7 
wv 回 bintree Debug [C/C++ Local Application] l | Name Value 
"v QË gdb/mi (12/17/07 11:04 AM) (Suspended) D btp 0x08049728 
"7 g® Thread [0] (Suspended: Breakpoint hit.) ox 8 
= 2 insert() Wvorkspace/bintree/bintree.c:39 0x08048447 b »> tmp 0x090a9008 
=} 1 main() workspace/bintree/bintree.c:76 0x08048531 
pl gdb (12/17/07 11:04 AM) E 
| («dl 
[À bintree.c $3 呈 日 (az Outline "m \ 25 
e, 
8B . V 
while (1) A ww 
{ 则 stdio.h 
if (x < tmp->val) { EJ stdlib.h 
if (tmp-»left != 0) { Fe m 
tmp = tmp-»left; e wwe 
) else ( 6 root: nsp 


tmp-»left - makenode(x); © makenode(int) : nsp 
break; 
€ insert(nsp*, int) : void 





) 


© printtree(nsp) : void 








&  main(int char?) -int 
EJ Console 2N V Tasks | El Problems| 0 Memory. B X %|& 858 HI m E rj ^O 
bintree Debug [C/C++ Local Application] gdb (12/17/07 11:04 AM) 
No symbol "new" in current context. | 














Stopped due to shared library event 
Stopped due to shared library event 
No symbol "val" in current context. 














| 7 | 
图 3-4 在 Eclipse 中 检查 标量 变量 
这 时 ， 可 以 使 用 Eclipse 的 Variables 视 图 ， 在 图 3-5 所 示 界 面 的 右上 方 可 以 看 到 。 单 击 tmp 劳 边 
的 三 角形 来 将 它 同 下 指 ， 然 后 回 下 滚动 一 行 ， 这 时 将 发 现 显 示 了 tmp->val。( 显 示 为 包含 12 )。 
继续 进行 这 一 过 程 。 当 单 击 了 1left 劳 边 的 三 角形 以 后 ， 将 看 到 网 3-6 中 显示 的 屏幕 ， 在 其 中 
可 以 看 到 tmp->left->val 为 8。 
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Elle Edt Refactor Navigate Search Run Project Window Help 
jf Gl @| B | #- O- Q- | # | 9 i- Era 





v [c]bintree Debug [C/C++ Local Application] 
v. QÈ adb/mi (12/17/07 11:04 AM) (Suspended) 
Y gf Thread [0] (Suspended: Breakpoint hit.) 
= 2 insert() /workspace/bintree/bintree.c 39 0x08048447 
三 1 main() Wworkspace/bintree/bintree.c:76 0x08048531 
pi gdb (12/17/07 11:04 AM) 





ae m 
if (x « tmp->val) { 
if (tmp-»left !- 0) ( 
tmp - tmp-»left; (P nsp: struct node* 
) else ( @ root: nsp 
tmp-»left - makenode(x); Ss. EE 
break; 


o 

} € insert(nsp*, int) : void 
o 
a 





printtree(nsp) : void 


mainfint rchar*I -int 3 
s [Efe] <= 
D ——— 








"val" in current context. 
"val" in current context. 
"val" in current context. 
"val" in current context. 
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v [E]bintree Debug [C/C++ Local Application] 
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V gf Thread [0] (Suspended: Breakpoint hit.) 
= 2 insert() Avorkspace/bintree/bintree.c:39 0x08048447 
三 1 main() jworkspacejbintree/bintree.c:76 0x08048531 
pi gdb (12/17/07 11:04 AM) 














if (tmp->left != 0) { - 
tmp = tmp->left; WD nsp: struct node* 
) else ( 6 root:nsp 


tmp-»left - makenode(x); 


tinea: makenode(int) : nsp 


e 

@ insert(nsp*, int) : void 
© printtree(nsp) : void 
&  main(int char*I -int 


bintree Debug [C/C++ Local Application] jworkspace/bintree/Debug/bintree (12/17/07 11:04 AM) 








图 3-6 “在 Eclipse 中 跟踪 指针 链接 


默认 情况 下 ，Variables 视 图 不 显示 全 局 变量 。 在 这 里 的 程序 中 ， 有 一 个 变量 root。 可 以 将 该 
变量 添加 到 Variables 视 图 中 : 在 该 视图 中 右 击 ， 选 择 Add Global Variables， 在 出 现 的 弹出 式 窗 口 
中 检查 root 的 框 ， 然 后 单 击 OK 按 钮 。 
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3.2.4 ”检查 动态 数组 
正如 第 1 革 所 讨论 的 ， 在 GDB 中 ， 可 以 输出 整个 数组 ， 比 如 对 于 如 下 数组 : 
int x[25]; 
方法 是 通过 键入 : 
(gdb) p x 
但 是 ， 如 果 是 动态 创建 的 数组 会 是 什么 样 呢 ?” 比 如 : 


int xx; 











x = (int *) malloc(25xsizeof(int)); 


如 果 要 在 GDB 中 输出 数组 ， 束 不 能 键入 : 


(gdb) p x 
这 个 命令 只 可 以 简单 打印 数组 地 址 。 也 不 能 键入 : 
(gdb) p *x 





这 样 只 会 输出 数组 的 一 个 元 素 x[8]。 仍 然 可 以 像 在 命令 p x[5] 中 那样 输出 单个 元 票 ， 但 是 不 
能 简单 地 在 x 上 使 用 print 命 令 和 输出 整个 数组 。 

1. GDB 中 的 解决 方案 

在 GDB 中 ， 可 以 通过 创建 一 个 人 工 数组 (artificial array) 来 解决 这 个 问题 。 来 看 如 下 代码 。 


1 dnt xx; 

3  main() 

a 1 

3 x = (int *) malloc(25*sizeof(int)); 
G x[3] = 12; 

: 0j 

然后 可 以 如 下 执行 : 

Breakpoint 1, main () at artif.c:6 

6 x = (int *) malloc(25*sizeof(int)); 
(gdb) n 

7 x[3] = 12; 

(gdb) n 

8 } 


(gdb) p *x@25 
$1 = (0, 0, O, 12, 0 «repeats 21 times>} 


可 以 看 到 ， 一 般 形 式 为 : 
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*pointerGQnumber of elements 
GDB 还 允许 在 适当 的 时 候 使 用 类 型 强制 转换 ， 比 如 : 


(gdb) p (int [25]) *x 
$2 = (0, 0, 0, 12, 0 «repeats 21 times>} 


2. DDD 中 的 解决 方案 

与 惯 币 一 样 ， 可 以 利用 GDB 方 法 ， 本 和 中 是 通过 DDD 探 制 台 使 用 人 工 数组 。 
另 一 个 选项 是 输出 或 显示 内 存 的 苑 围 〈 参 见 3.2.7 节 )。 

3. Eclipse 中 的 解决 方案 

这 里 可 以 使 用 Eclipse 的 Display As Array 命 令 。 

例如 ， 证 我 们 稍微 扩展 一 下 前 面 的 示例 。 

















1 Int xx; 

3 main() 

pod 

5 int y; 

6 x = (int *) malloc(25xsizeof(int)); 
7 scant ("%d%d" ,&x[3],&x[8]); 

8 y = x[3] + x[8]; 

9 printf("%d\n",y); 

wo } 





[Bou H B TEZRyW HR. HIMA t Variable KHA ERER EZM. AAE 
Variables 视 图 中 右 击 x， 并 选择 Display As Array。 在 得 到 的 弹出 框 中 ， 填 充 Start Index#lLength# 
段 ， 比 如 分 别 填写 为 0 和 25 来 显示 整个 数组 。 屏 做 现在 如 图 3-7 所 示 。 可 以 看 到 Variable 视 图 中 的 数 
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Y 回 dyn Debug [C/C++ Local Application] 
"v @gdb/mi (12/17/07 8:53 PM) (Suspended) 
V a? Thread [0] (Suspended) 


vi |workspace/dyn/Debug/dyn (12/17/07 8:53 PM) | 
三 1] ma workspace/dyn/dyn.c:8 0 




















ain() 
int y; 
x - (int *) malloc(25*sizeof(int)); 
scanf("XdXd" ,&x[3] ,&x[8]); 














(E Console 3 A Tasks | E: Problems| G Memory | a 
dyn Debug [C/C++ Local Application] /workspace/dyn/Debug/dyn (12/17/07 8:53 PM) 
then: then/endif not found 




















图 3-7 ”在 Eclipse 中 显示 一 个 动态 数组 


J- 
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|a 
Ei 
M 
pd 
aa 
talo 





ZH, NA 
(0,0,0,1,0,0,0,0,2,0,«repeats 16 times») 
值 1 和 2 来 目 我 们 对 程序 的 输入 ， 参 见 控 制 合 视图 。 
3.2.5 C++ 代码 的 情况 
为 了 说 明 C++ 代 人 码 的 情况 ， 下 面 古 前 和 面 用 过 的 三 又 树 示例 的 C++ 版 本 。 


// bintree.cc: routines to do insert and sorted print of a binary tree in C++ 








#include «iostream.h» 


class node { 
public: 
static class node *root; // root of the entire tree 
int val; // stored value 
class node «left; // ptr to smaller child 
class node «right; // ptr to larger child 
node(int x); // constructor, setting val = x 
static void insert(int x); // insert x into the tree 
static void printtree(class node «nptr); // print subtree rooted at *nptr 


class node *node::root = 0; 


node: :node(int x) 


val = x; 
left = right = 0; 


void node::insert(int x) 
{ 
if (node::root == 0) { 
node::root = new node(x); 
return; 
} 
class node *tmp=root; 
while (1) 
{ 
if (x < tmp->val) 
{ 


if (tmp->left != 0) { 


32 ”变量 的 高 级 检查 和 设置 91 


tmp - tmp-»left; 

} else { 
tmp->left = new node(x); 
break; 


} 


} else { 


if (tmp-»right != 0) { 
tmp - tmp-»right; 

} else { 
tmp->right = new node(x); 
break; 


void node::printtree(class node x«np) 
{ 
if (np == 0) return; 
node: :printtree(np->left) ; 
cout << np->val << endl; 
node: :printtree(np->right) ; 
} 
int main(int argc, char xargv[]l) 
i 
for (int i = 1; i « argc; i++) 
node: : insert(atoi(argv[i])); 
node: :printtree(node: : root) ; 


} 

仍然 与 以 前 一 样 编译 ， 并 且 一 定 要 让 编译 器 在 可 执行 文件 中 保留 符号 表 。™ 

相同 的 GDB 命 令 也 能 起 作用 ， 但 是 得 出 略 有 人 不同。 例如， 再 次 输出 insert() 中 的 tmp 指 回 对 
象 的 内 容 ， 可 以 得 到 如 下 输出 。 


(gdb) p *tmp 
$6 = {static root = 0x8049d08, val = 19, left = 0x0, right = 0x0} 


CD 不 过 ,在 这 方面 可 能 产生 各 种 各 样 的 问题 。 见 GDB 手 册 中 关于 可 执行 文件 格式 的 内 容 。 这 里 的 示例 使 用 G++ 编 译 
融 《〈《GCC 的 C++ 包 攻 露 )， 用 -g 选 项 指定 应 当 保留 符 亏 表 。 我 们 还 答 试 过 -gstabs 选 项 ， 虽 然 它 也 能 起 作用 ， 但 是 
产生 的 结 采 不 太 理 想 。 
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这 类 似 于 C 程 序 的 情况 ,只 是 现在 还 输出 了 static 变 量 node: :root 的 值 ( 它 应 当 是 该 变量 值 ， 
因为 它 是 该 类 的 一 部 分 )。 
当然 ， 必 须 记 住 ，GDB 需 要 根据 与 C++ 使 用 的 相同 作用 域 规则 来 指定 变量 。 例 如 ; 











(gdb) p *root 

Cannot access memory at address OxO 

(gdb) p *node::root 

$8 = {static root = 0x8049d08, val = 12, left = 0x8049d18, right = 0x8049d28} 


我 们 需要 通过 它 的 全 名 node: :root 指 定 root。 
虽然 GDB 和 DDD 没 有 内 置 类 浏览 器 , 但 是 GDB 的 ptype 命 令 可 以 很 方便 地 快速 浏览 类 或 结构 
(struct) 的 结构 〈structure)， 例 如 : 
(gdb) ptype node 
type = class node { 
public: 
static node «root; 
int val; 
node *left; 
node *right; 


node(int); 
static void insert(int); 
static void printtree(nodex) ; 


j 


在 DDD 中 ， 可 以 右 击 闫 或 变量 名 ， 然 后 在 弹出 荣 单 中 选择 What Is 来 得 到 相同 的 信息 。 
Eclipse 中 有 Outline 视 图 ， 因 此 可 以 轻松 地 以 这 种 方式 得 到 类 信息 。 
3.2.6 监视 局 部 变量 

在 GDB 中 ， 可 以 通过 调用 info locals 命 令 列 出 当前 栈 帆 中 所 有 局 部 变量 的 值 。 

在 DDD 中 ， 甚 全 可 以 通过 单 击 Data 一 Display Local Variables 来 显示 局 部 变量 。 这 会 导致 DDD 
数据 窗口 一 个 区 域 专 门 用 来 显示 局 部 变量 〈 当 单 步调 试 程序 时 会 更 新 )。GDB 中 似乎 没有 做 这 件 
事 的 直接 方式 , 不 过 可 以 逐个 断 点 地 做 这 件 事 : 为 希望 目 动 输出 局 部 变量 的 每 个 断 点 在 commands 
例 程 中 加 上 info locals 命 令 。 

可 以 看 到 ，Eclipse 在 Variables 视 图 中 显示 局 部 变量 。 

3.2.7 ”直接 检查 内 存 

在 有 些 情况 下 ,可 能 希望 检查 给 定 地 址 的 内 存 ， 而 不 是 通过 变量 的 名 称 。GDB 为 这 种 目的 提 
供 了 x 命令 (表示 examine)。 在 DDD 中 ,选择 Data 一 Memory, 18 Eoo pa RUE AL, 并 在 Print 和 Display 
之 间 做 选择 。Eclipse 有 一 个 Memory 视 图 ， 在 其 中 可 以 创建 Memory Monitors. 

这 主要 适用 于 汇编 语言 环境 ， 第 8 章 将 详细 讨论 。 



















































































3.3 A.GDB/DDD/Eclipse 中 设置 变量 93 


3.2.8 print 和 display 的 高 级 选项 
print 和 display 命 令 允 许 指定 可 选 的 格式 。 例 如 : 


(gdb) p/x y 











会 以 十 六 进 制 格 式 显 示 变 量 ， 而 不 是 十 进 制 格式 。 其 他 第 用 的 格式 为 c 表 不 子 从 (character)，s 


表示 字符 串 〈string)，f 表 示 浮 点 (floating-point). 
可 以 临时 禁用 某 个 显示 项 。 例 如 ， 


(gdb) dis disp 1 





临时 至 用 显示 列表 中 的 条 目 1。 如 下 不 知道 条 目 写 ， 可 以 通过 info disp 命 令 检 人 脸 。 要 重新 局 用 条 


目 ， 使 用 enable， 例 如 ， 


(gdb) enable disp 1 


要 完全 删除 显示 的 条 目 ， 使 用 undisplay， 例 如 ， 


(gdb) undisp 1 





3.3 ”从 GDB/DDD/Eclipse 中 设置 变量 


在 有 些 情况 下 , 在 单 步调 试 程序 的 过 程 中 间 想 要 使 用 调试 器 设置 变量 的 值 。 这 样 可 以 快速 地 
判断 某 个 程序 错误 的 各 种 来 源 都 会 产生 怎样 的 结果 。 
在 GDB 中 ， 值 的 设置 非常 容易 ， 例 如 ， 


(gdb) set x = 12 


会 将 x 的 当前 值 改 成 12。 

DDD 中 似乎 没有 用 鼠标 来 设置 这 样 的 值 的 方式 , 但 是 同样 , 可 以 通过 DDD 控 制 台 窗口 在 DDD 
中 执行 任何 GDB 命 令 。 

在 Eclipse 中 ， 打 开 Variables 视 网 ， 右 击 要 设置 其 值 的 变量 ， 并 选择 Change Value。 然 后 可 以 
在 弹出 窗口 中 填充 独 值 。 

可 以 通过 GDB 的 set args 命 令 设置 程序 的 命令 行 参数 。 然 而 ， 与 第 1 草 介 绍 的 方法 相 比 ， 这 
种 方法 并 没有 优势 ， 第 1 章 的 方法 只 要 在 调用 GDB 的 run 命 令 时 使 用 新 参数 即 可 。 这 两 种 方法 是 完 
全 等 价 的 。 例 如 ， 如 下 代码 : 


(gdb) set args 1 52 19 11 















































并 不 会 立即 将 argv[1] 改 成 1, argv[2] 改 成 52, 等 等 , ELI PX IT runn S IET IEEE. 





GDB 有 用 来 检查 当前 函数 参数 的 info args 命 令 。 当 早 击 Data 一 Display Areuments 时 ，DDD 
会 提供 这 一 功能 。 
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3.4 GDB 自己 的 变量 

除了 在 程序 中 声明 的 变量 外 ，GDB 还 为 其 他 变量 提供 了 一 些 机 制 。 
3.4.1 使 用 值 历史 

GDB 的 print 命 令 的 输出 值 被 标 为 $51、$2 等 ， 这 些 值 统称 为 值 历 史 。 在 将 来 执行 print 命 令 时 
使 用 这 样 的 值 历史 会 比较 方便 。 

例如 ， 考 虑 3.1 节 的 bintree 示 例 。GDB 的 部 分 会 话 可 能 如 下 所 示 。 

(gdb) p tmp-»left 

$1 = (struct node *) 0x80496a8 

(gdb) p *(tmp->left) 

$2 = {val = 5, left = 0x0, right = 0x0} 


(gdb) p *$1 
$3 = {val = 5, left = 0x0, right = 0x0} 


这 里 发 生 的 事情 是 ， 当 我 们 输出 指针 tmp->left 的 值 后 发 现 它 为 非 0， 我 们 决定 输出 这 个 指针 
指 回 的 内 容 。 我 们 输出 这 样 的 内 容 两 次 。 第 一 次 采用 方便 的 方式 ， 第 二 次 通过 值 历史 。 

在 第 三 次 输出 中 ， 我们 引用 值 历史 中 的 $1。 如 果 没 有 进行 常规 输出 ， 则 可 以 使 用 特殊 的 值 历 
史 变 量 $。 

(gdb) p tmp-»left 

$1 = (struct node *) 0x80496a8 


(gdb) p *$ 
$2 = {val = 5, left = 0x0, right = 0x0} 





























3.4.2 方便 变量 

假设 有 一 个 指针 变量 p， 它 在 不 同 的 时 候 指 问 链 表 中 的 不 同 节点 。 在 调试 会 话 期 间 ， 可 能 希 
望 记 录 特 定 节 点 的 地 址 ， 比 如 ， 因 为 你 希望 重新 检查 调试 过 程 中 节点 在 不 同时 候 的 值 。 当 p 首 次 
到 达 该 节点 时 ， 可 以 这 样 做 : 


(gdb) set $q = p 
此 后 执行 的 命令 如 下 : 


(gdb) p *$q 





























这 里 的 变量 $q 称 为 方便 变量 (convenience variable). 
方便 变量 会 根据 C 规 则 改变 值 。 例 如 ， 来 看 代码 : 


int w[4] = {12,5,8,29}; 








main() 


34 GDB 自己 的 变量 95 


w[2] - 88; 
Í 


在 GDB 中 可 能 做 一 些 类 似 如 下 的 事情 。 


Breakpoint 1, main () at cv.c:7 
7 w[2] = 88; 
(gdb) n 

8 } 

(gdb) set $i = 0 
(gdb) p w[$i++] 

$1 = 12 

(gdb) 

$2 =5 

(gdb) 

$3 - 88 

(gdb) 

$4 - 29 


为 了 理解 这 里 发 生 了 什么 ， 回 顾 一 下 ， 如 果 我 们 简单 地 在 GDB 中 按 下 ENTER 键 而 没有 发 出 
命令 ，GDB 惑 会 将 这 一 操作 看 作 重 复 上 一 个 命令 的 请 求 。 在 上 面 的 GDB 会 话 中 , 保持 按 下 ENTER 
键 ， 就 意味 着 在 要 求 GDB 重 复 如 下 命令 。 


(gdb) p w[$i++] 


这 不 仅 意味 着 会 输出 一 个 值 ， 而 且 方便 变量 9i 也 会 递增 。 














说 明 ”几乎 可 以 为 方便 变量 选择 任何 名 称 ， 不 过 有 一 些 人 例外。 例如， 不 能 给 方便 变量 起 名 为 $3， 
为 那 是 为 值 历史 保留 的 名 称 。 另 外 ， 如 果 用 的 是 汇编 语言 ， 则 不 应 使 用 寄存 器 名 称 。 例 如 ， 
对 于 Intel x86 系 列 机 器 ， 有 一 个 寄存 器 名 为 EAX， 在 GDB 中 它 被 称 为 geax， 如 果 在 汇编 语言 
层 上 工作 ， 则 不 要 选择 这 个 名 称 作为 方便 变量 
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BAA, CH Set RD AAD SASS AM, RADA REECE Hi ERA SC 
现时 ，C 语 言 才 比 较 小 ， 实 际 上 这 个 库 相 当 庞 大 。 而 且 很 多 程序 员 认 为 C 语 言 是 易 用 语言 ， 那 是 
因为 他 们 还 没有 过 到 指针 。 

般 而 言 ， 程 序 错误 会 导致 下 面 两 件 事 的 发 生 。 

Qa 导 化 程序 做 一 些 程序 员 没 有 打算 做 的 事 。 这 样 的 程序 错误 通常 因为 逻辑 缺陷 ， 比 如 在 第 3 
章 的 数字 排序 程序 中 ， 将 节点 放 在 了 树 的 错误 分 文 上 。 到 目前 为 止 我 们 一 直 在 集中 介绍 
这 种 程序 错误 。 

O 导致 程序 “爆炸 ”或 “崩溃 ”。 这 些 程序 错误 通常 与 指针 的 误 操 作 或 误 用 有 关 。 这 是 本 章 
将 介绍 的 程序 错误 类 型 。 


4.1 BRAN: AEE 


当 程序 骨 省 时 到 撒 发 生 了 什么 事 ? 我 们 这 里 将 解释 一 下 , HRE I 77 HERB DIT RET VA 
ATA TR 


41.1 为 什么 程序 会 表演 


用 编程 界 的 行 话 说 ， 当 某 个 错误 导致 程序 突然 和 异常 地 停止 执行 时 ， 程 序 毅 渍 。 迄 今 最 常见 
的 导致 程 序 骨 尝 的 原因 是 试图 在 未 经 允许 的 情况 下 访问 一 个 内 存 位 置 。 便 件 会 感知 这 件 事 ， 并 执 
行 对 操作 系统 (OS) 的 跳 转 。 在 本 书 主要 使 用 的 Unix 系 列 的 平台 上 ， 操 作 系 统一 般 会 宣布 程序 
导致 了 段 错误 (seg fault)， 并 停止 程序 的 执行 。 在 微软 的 Windows 系 统 上 ， 对 应 的 术语 是 一 般 保 
护 错误 (general protection fault)。 无 论 是 哪个 名 称 ， 硬 件 都 必须 文 持 虚 拟 内 存 ， 而 且 操 作 系 统 必 
须 使 用 虚拟 内 存 才 会 发 生 这 个 错误 。 虽 然 这 是 如 今 的 通用 计算 机 的 标准 ， 但 是 读者 应 记 住 ， 专 用 
的 小 型 计算 机 一 般 没 有 这 种 情况 ， 比 如 用 来 控制 机 器 的 租 入 式 计 算 机 。 

为 了 有 效 地 使 用 GDB/DDD 处 理 段 错误 ， 醒 要 的 是 要 真正 理解 内 存 访问 错误 是 如 何 发 生 的 。 
在 下 面 几 页 中 ， 我 们 简要 介绍 一 下 虚拟 内 存 (VM) 在 程序 执行 期 间 所 起 的 作用 。 我 们 将 把 焦点 
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放 在 虚拟 内 存 问 题 与 段 错误 之 间 的 关系 上 。 因 此 ， 即 使 你 在 计算 机 课程 中 学 习 过 虚拟 内 存 ， 本 节 
介绍 的 内 容 仍 然 可 以 帮助 你 处 理 调 试 工作 中 的 段 错 误 。 
41.2 内存 中 的 程序 布局 

正如 前 面 提 到 的 ， 当 程序 中 有 内 存 访问 问题 时 ， 会 发 生 段 错误 。 为 了 讨论 这 件 事 ， 重 要 的 是 
先 理解 程序 在 内 存 中 是 如 何 布局 的 。 

在 Unix 平 台 上 ， 为 程序 分 配 的 虚拟 地 址 的 布局 通常 类 似 于 图 4-1。 

















图 4-1 程序 内 存 布局 

这 里 虚拟 地 址 0 在 最 下 方 ， 箭 头 显 示 了 其 中 两 个 组 件 〈 扒 和 栈 ) 的 增长 方 回 ， 当 它们 增长 时 ， 

消耗 掉 未 使 用 的 自由 区 域 。 各 个 部 分 的 作用 如 下 所 示 。 

O 文本 区 域 ， 由 程序 源 代 码 中 的 编译 亏 产 生 的 机 器 指令 组 成 。 例 如 ， 每 行 C 代 码 通 间 会 转换 
成 两 到 三 条 机 器 指令 ， 所 有 结果 指令 的 集合 组 成 了 可 执行 文件 的 文本 部 分 。 这 个 部 分 的 
正式 多 称 是 .text。 

这 一 组 件 包括 前 态 链 接 代 人 码 ， 包 括 做 初始 化 工作 然后 调用 main() 的 系统 代 人 码 /usr/ib/ 
crt0.0。 

O 数据 区 域 ， 包 含 在 编译 时 分 配 的 所 有 程序 变量 ， 即 全 局 变量 。 
实际 上 ,这 个 区 域 由 各 种 各 样 的 子 区 域 组 成 。 第 一 个 子 区 域 称 为 .data， 由 初始 化 过 的 变量 
组 成 ， 即 在 如 下 所 示 的 声明 中 给 出 的 变量 。 





























int x = 5 
还 有 一 种 用 于 存放 未 初始 化 数据 的 .pss 区 域 ， 在 如 下 所 示 的 声明 中 给 出 。 
int y; 


当 程 序 在 运行 时 从 操作 系统 中 请 求 额外 的 内 存 时 (例如 ， 当 在 C 语 言 中 调用 malloc() 时 ， 
或 者 在 C++ 中 调用 new 结 构 时 ),， 请 求 的 内 存在 名 为 堆 的 区 域 中 分 配 。 如 末 堆 空间 不 够 ,可 
以 通过 调用 brk() 来 扩展 扒 《〈 这 正 是 malloc() 及 相关 函数 所 做 的 事情 )。 


E 
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O 栈 区 域 ， 是 用 来 动态 分 配 数 据 的 空间 。 函 数 调用 的 数据 《包括 参数 、 局 部 变量 和 返回 地 
址 ) 都 存储 在 栈 上 。 每 次 进行 函数 调用 时 栈 都 会 增长 ， 每 次 函数 返回 到 其 调用 者 时 栈 都 


RHF o 











a 图 4-1 中 没有 显示 程序 的 动态 链接 代码 ， 它 的 位 置 与 平台 有 关 ， 但 是 它 确实 在 茶 个 地 方 


存在 。 


让 我 们 稍微 探究 一 下 。 来 看 如 下 代码 。 


int q[200]; 


int main( void ) 
i 


int i, n, *p; 


p = malloc(sizeof(int)); 


scanf ("%d", &n); 


for (i = 0; i < 200; 


qli] = i; 


printf("%x %x 


return 0; 


} 


i++) 





AX ^ *X\n", main, q, p, &i, scanf); 


虽然 该 程序 本 身 作 用 并 不 大 , 但 是 我 们 将 它 编 号 成 一 个 工具 来 非 正 式 地 探索 虚拟 地 址 空间 的 
布局 。 出 于 这 个 目的 ， 让 我 们 运行 以 下 程序 。 


为 a.out 
5 


80483f4 80496a0 209835008 btfb3abec 











8048304 


从 运行 结果 可 以 看 到 文本 区 域 、 数 据 区 域 、 堆 、 栈 和 动态 链接 函数 的 大 体位 置 分 别 是 
6x686483f4、6x686496a6、6x69835668、6xbfb3abec 和 6x688648364。 
可 以 通过 三 看 这 一 过 程 的 maps 文 件 来 得 到 程序 在 Linux 上 的 精确 内 存 布局 情况 。 这 个 过 程 号 








是 21111， 因 此 我 们 将 查看 相应 的 文件 /jproc/21111maps。 


$ cat /proc/21111/maps 
009f1000-009f2000 r-xp 
009f2000-00a0b000 r-xp 
00a0b000-00a0c000 
00a0c000-00a0d000 
00a0f000-00b3c000 
00b3c000-00b3e000 
00b3e000-00b3f000 
00b3f000-00b42000 
08048000- 08049000 


r-xp 
rwxp 
r-xp 
r-xp 
rwxp 
rwxp 
r-xp 


009f1000 
00000000 
00018000 
00019000 
00000000 
0012d000 
0012f000 
00b3f000 
00000000 


:00 
:01 
:01 
:01 


0 
4116750 
4116750 
4116750 
4116819 
4116819 
4116819 
0 
18815309 


| vdso | 
/lib/1d-2.4.s0 
/lib/ld-2.4.so 
/lib/ld-2.4.s0 
/lib/libc-2.4.so 
/lib/libc-2.4.so 
/lib/libc-2.4.so 


/home/matloff/a.out 
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08049000-0804a000 rw-p 00000000 00:16 18815309  /home/matloff/a.out 
09835000-09856000 rw-p 09835000 00:00 0 [heap | 
b7ef8000-b7ef9000 rw-p b7ef8000 00:00 0 

b7f14000-b7f16000 rw-p b7f14000 00:00 0 

bfb27000-bfb3c000 rw-p bfb27000 00:00 0 [ stack] 


你 不 需要 理解 所 有 这 些 代码 。 重 点 是 在 该 显示 结果 中 ,可 以 看 到 文本 和 数据 区 域 ( 从 文件 q.out 
中 )， 以 及 堆 和 栈 。 从 中 也 可 以 看 到 C 库 〈 对 于 调用 scanf()、malloc() 和 printf()) 被 放 在 何 处 
(从 文件 Lip/Nibc-2.4.s0o)。 此 外 还 应 识别 出 一 个 权限 字段 ， 其 格式 类 似 于 使 用 显示 的 文件 权限 ， 
比如 表示 rw-p 这 样 的 权限 。 后 者 很 快 束 会 介绍 。 


4.1.3 ”页 的 概念 


图 4-1 所 示 的 虚拟 地 址 空间 概念 上 从 0 延伸 到 2”-1， 其 中 w 是 机 器 上 按 位 表示 的 单词 大 小 。 当 
然 ， 程序 通 党 只 会 使 用 该 空间 的 很 少 一 部 分 ， 操 作 系 统 可 能 保留 空间 的 一 部 分 给 自己 用 。 但 是 程 
序 员 编 写 的 代码 可 以 通过 指针 在 该 范围 内 的 任何 地 方 生成 地 址 。 通常 这 样 的 地 址 会 是 错误 的 ， 原 
因 在 于 程序 中 有 程序 错误 ! 

虚拟 地 址 空间 是 通过 组 织 成 称 为 页 Cage) 的 块 来 得 看 的 。 在 Pentium 便 件 上 ， 默 认 页 大 小 是 4 096 
学 节 。 物 理 内 存 〈 包 括 RAM 和 ROM) 也 都 是 分 成 页 来 查看 的 。 当 程序 被 加 载 到 内 存 中 执行 时 ， 操 作 
系统 会 安排 程序 的 部 分 页 存储 在 物理 内 存 的 页 中 。 这 些 页 称 为 被 “ 驻 留 ” 其 余部 分 存储 在 人 磁 各 上 。 

在 执行 期 间 的 各 个 阶段 ， 将 需要 一 些 当 前 没有 驻 留 的 程序 页 。 当 发 生 这 种 情况 时 ， 硬 件 会 感 
知 到 ， 将 控制 权 转 移 给 操作 系统 。 后 者 将 所 需 页 带 到 内 存 中 ， 可 能 会 伏 换 挥 当 前 驻 留 的 男 一 个 程 
序 页 〈 如 果 没 有 可 用 的 上 自由 内 存 页 )， 然 后 将 控制 权 返 回 给 程序 。 如 果 有 被 驱逐 的 程序 页 ， 束 会 
变 成 非 驻 留 页 ， 被 存储 在 人 磁盘 上 。 

为 了 管理 所 有 这 些 操作 ， 操 作 系 统 为 每 个 过 程 设立 了 一 个 页 表 (page table)。(Pentium 的 页 表 
有 一 个 层次 结构 , 但 是 这 里 为 了 简单 起 见 , 我 们 假定 只 有 一 层 , 而且 这 里 讨论 的 大 多 数 内 容 都 不 是 
Pentium 特 有 的 。 〉 这 一 过 程 的 每 个 虚拟 页 在 表 中 都 有 对 应 的 一 个 项 (entry)， 其 中 包括 如 下 信息 。 

a 这 个 页 在 内 存 中 或 者 磁盘 上 的 当前 物理 位 置 。 如 果 是 在 破 盘 上 ， 页 表 上 对 应 的 项 会 指示 

页 是 非 驻 留 的 ， 可 能 包含 一 个 指针 ， 指 回 最 终 导 致 磁盘 上 的 物理 位 置 的 一 个 列表 。 例 如 ， 
它 可 能 显示 : 程序 的 虚拟 页 12 是 驻 留 的 ， 位 于 内 存 的 物理 页 200 中 。 

Q 该 页 的 权限 分 3 种 : 读 、 写 和 执行 。 

注意 ， 操 作 系统 不 会 将 不 完整 的 页 分 配给 程序 。 人 例如， 如果 要 运行 的 程序 总 共 大 约 有 10 000 
学 廊 ， 如 果 完 全 加 载 ， 会 占 3 个 内 存 页 。 它 不 会 仅 占 2.5 个 页 ， 因 为 页 是 虚拟 内 存 系 统 能 够 操作 的 
最 小 内 存单 元 。 这 是 调试 时 要 记 住 的 很 重要 的 一 点 ， 因 为 正如 下 面 将 介绍 的 ， 这 一 点 暗示 了 程序 
的 一 些 错误 内 存 访 问 不 会 触发 段 错误 。 换 言 之 ， 在 调试 会 话 期 间 ， 不 能 这 么 想 :“ 这 行 代 人 码 一 定 
没 问 题 ， 因 为 它 没 有 3 引起 段 错 误 。” 
4.1.4 页 表 的 作用 

采用 图 4-1 中 的 虚拟 地 址 空间 ,继续 假设 页 大 小 为 4096 字 和 节 。 然后 虚拟 页 0 包含 虚拟 地 址 空间 
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的 第 0~4 095 字 节 ， 页 1 包含 第 4 096~8 191 字 节 ， 以 此 类 推 。 

表面 提 到 ， 当 我 们 运行 程序 时 ， 操 作 系 统 创建 一 个 用 来 管理 执行 程序 代码 进程 的 虚拟 内 存 页 
Ro (第 $ 章 介绍 线程 时 将 概述 操作 系统 进程 .) 每 当 该 进程 运行 时 ， 人 硬件 的 页 表 寄存 器 都 会 指 问 
UK. 

从 概念 上 讲 ， 进 程 虚拟 地 址 空间 的 每 个 页 在 页 表 中 都 有 一 个 页 表 项 《在 实践 中 ， 可 以 使 用 各 
种 技巧 来 压缩 该 表 )。 这 个 页 表 项 存储 与 该 页 相关 的 各 块 信息 。 与 段 错误 相关 的 数据 是 该 页 的 访问 
权限 ， 它 类 似 于 文件 访问 权限 : 读 、 写 和 执行 。 例 如 ， 页 3 的 页 表 项 将 指出 进程 是 否 具 有 从 该 页 读 
取 数 据 的 权限 ， 癌 该 页 中 写 数 据 的 权限 ， 以 及 在 该 页 上 执行 指令 的 权限 (如 果 页 中 包含 机 器 码 )。 

当 程 序 执行 时 ， 它 会 如 上 文 所 述 连续 访问 各 个 区 域 ， 导 致 便 件 按 以 下 几 种 情况 处 理 页 表 。 

Q 每 次 程序 使 用 其 全 局 变量 时 ， 需 要 具有 对 数据 区 域 的 读 / 写 访问 权限 。 

O 每 次 程序 访问 局 部 变量 时 ， 程 序 会 访问 栈 ， 需 要 对 栈 区 域 具 有 恋 / 写 访问 权限 。 

O 每 次 程序 进入 或 离开 函数 时 ， 会 对 该 栈 进 行 一 次 或 多 次 访问 ， 需 要 对 栈 区 域 具 有 读 写 访 

问 权 限 。 
O 每 次 程序 访问 通过 调用 malloc() 或 new 创 建 的 存储 空间 时 ， 都 会 发 生 堆 访问 ， 也 需要 该 / 
写 访 问 权 限 。 

a 程序 执行 的 每 个 机 器 指令 都 是 从 文本 区 域 (或 者 从 动态 链接 代码 的 区 域 〉 取 出 的 ， 因 此 

需要 具有 该 和 执行 权限 。 

在 程序 的 执行 期 间 ， 生 成 的 地 址 会 是 虚拟 的 。 当 程序 试图 访问 某 个 虚拟 地 址 处 的 内 存 时 ， 比 
如 》， 便 件 驶 会 将 其 转换 成 虚拟 页 号 w， 它 等 于 y 除 以 4096《〈 其 中 除法 是 整除 算法 ， 舍 去 余数 )。 然 
后 便 件 会 检查 页 表 中 的 页 表 项 v 来 得 看 访 页 的 权限 是 否 与 要 执行 的 操作 匹配 。 如 果 匹 配 ， 便 件 束 
会 从 这 个 表 项 中 得 到 所 需 位 置 的 实际 物理 页 号 ， 然 后 完成 请 求 的 内 存 操作 。 但 是 如 和 果 该 表 项 显示 
请 求 的 操作 不 具有 恰当 的 权限 ， 人 硬件 驶 会 执行 内 部 中 断 。 这 会 导致 跳 转 到 操作 系统 的 错误 处 理 例 
程 。 然 后 ， 操 作 系统 一 般 会 宣告 一 个 内 存 访 问 违 例 ， 并 停止 程序 的 执行 〈 即 从 进程 表 和 内 存 中 去 
挥 程序 )。 

程序 中 的 错误 会 导致 权 限 不 匹配 ,并 在 上 面 列 出 的 某 个 类 型 的 内 存 访 问 期 间 生 成 段 错 误 。 例 
如 ， 假 设 程序 中 包含 如 下 全 局 声明 : 


int x[100]; 

并 假设 代码 包含 下 面 这 条 语句 : 

在 C/C++ 中 ， 表 达 式 x[i] 等 价 于 《实际 上 也 意味 看 ) *(x+i)， 即 地 址 x+i 指 回 的 内 存 位 置 的 
内 容 。 如 采 佣 移 量 i 为 200 000， 那 么 这 个 表达 式 可 能 会 产生 虚拟 内 存 地 址 >， 它 超出 了 操作 系统 
为 该 程序 的 数据 区 域 指定 的 页 组 范围 (编译 器 和 连接 程 订 为 数组 x[] 安 排 的 存储 地 方 )。 然 后 当 试 
图 执行 号 操作 时 会 发 生 段 销 诈 。 

如 来 x 是 局 部 变量 ， 那 么 会 在 栈 区 域 友 生 同 样 的 问题 。 
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与 执行 权限 相关 的 违例 的 产生 更 微妙 。 例 如 ， 在 汇编 语言 程序 中 ,假设 有 一 个 名 为 sink 的 数 
据 项 和 一 个 名 为 sunk() 的 函数 。 当 调用 这 一 函数 时 ， 可 能 不 小 心 写成 





call sink 
而 不 是 

call sunk 

这 会 导致 一 个 段 错 误 ， 因 为 程序 会 试图 在 sink 的 地 址 处 执行 指令 ， 访 地址 位 于 数据 区 域 ， 而 
数据 区 域 的 页 没有 局 用 执行 权限 。 

C 语 言 中 类 似 这 样 的 编码 错误 不 会 导致 段 错误 ， 因 为 当 将 sink 声 明 为 变量 时 ， 编 译 堪 会 以 如 
下 这 行 代码 为 目标 : 


z = Sink(5); 
但 是 在 使 用 指向 函数 的 指针 时 ， 很 容易 发 生 这 种 程序 错误 。 来 看 如 下 的 代码 。 


int f(int x) 
{ 























return X*X; 


} 
int (*p)(int); 


int main( void ) 


{ 
p= f; 
u = (*p)(5); 
printf("%d\n", u); 
return 0; 
} 











要 是 态 记 了 语句 p = f;， 那 么 p 会 为 0， 你 将 试图 执行 位 于 页 0 的 指令 ， 而 你 不 具有 对 这 个 页 
的 执行 〈 或 其 他 ) 权限 (参见 图 4-1)。 
4.1.5 ”轻微 的 内 存 访 问 程序 错误 可 能 不 会 导致 段 错误 

为 了 加 深 对 段 错 误 发 生 方 式 的 理解 ， 来 看 如 下 代码 ， 当 执行 该 代码 时 ， 其 行为 表明 : 在 预料 
到 有 段 错 误 的 地 方 不 一 定 都 会 发 生 段 错误 。 


int g[200]; 











main() 


{ 


int i; 
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for (i = 0; i « 2000; i++) { 
qli] = i; 
Í 
} 


注意 ， 这 名 程序 员 显然 在 循环 中 有 笔 误 ， 设 置 了 2 000 次 迭代 ， 而 不 是 200 次 。 无 论 数组 索引 
是 否 超出 了 边界 ，C 语 言 编译 器 在 编译 时 不 会 捕获 这 一 错误 ， 编 译 器 生成 的 机 器 码 在 执行 时 也 不 
会 检查 该 错误 。( 这 是 GCC 的 错误 ， 尽 管 它 还 具有 不 提供 这 样 的 运行 时 索引 检查 的 -fmudflap 选 
项 。) 

在 执行 时 ， 很 可 能 发 生 段 错误 。 然 而 ,错误 发 生 的 时 机 可 能 让 人 人 大吃一惊。 这 种 错误 可 能 不 
是 出 现在 “自然 ”时 间 ， 即 当 i=200 时 ， 相 反 ， 它 可 能 出 现在 那个 时 刻 后 面 很 久 。 

为 了 说 明 这 一 点 , 我 们 在 Linux PC 上 的 GDB 下 运行 该 程序 , 这 样 可 以 方便 地 查询 变量 的 地 址 。 
结果 发 现 段 错误 不 是 发 生 在 i=200 处 ， 而 是 在 i=728 处 。( 你 的 系统 可 能 会 给 出 不 同 的 结果 ， 但 原 
理 是 一 样 的 .) 让 我 们 看 一 下 原因 。 

通过 对 GDB 的 查询 ， 我 们 发 现 数组 q[] 在 地 址 ex8e497bf 处 结束 ， 即 q[199] 的 最 后 一 字 节 在 该 
内 存 人 位置。 考虑 到 Intel 的 页 大 小 是 4 096 字 节 ， 这 种 机 器 是 32 位 的 字 大 小 ， 所 以 一 个 虚拟 地 址 被 分 
解 为 一 个 20 位 的 页 号 和 一 个 12 位 的 偏 移 量 。 在 本 市 的 示例 中 ，q[] 在 虚拟 页 号 6x8849=32841 处 结 
束 ， 偶 移 量 为 ex7bf=1983。 因 此 ， 分 配 了 q 的 内 存 的 页 上 仍然 有 4 096-1 984=2 112 字 和 。 访 空间 
可 以 存放 2 112/4=528 个 整数 变量 〈 因 为 这 里 使 用 的 机 器 上 每 个 变量 是 4 字 节 宽 )， 本 节 示 例 的 代码 
似乎 认为 包含 q 的 元 素 的 位 置 是 在 200 一 727 之 间 。 

当然 ，q[] 的 那些 元 素 不 存在 ， 但 是 编译 器 没有 抱 奶 。 人 硬件 也 没有 抱 扰 ， 因 为 这 种 写 操作 仍 
然 是 在 我 们 肯定 上 共有 写 权 限 的 页 上 执行 的 《因为 q[] 的 部 分 实际 元 素 位 于 该 数据 段 上 ， 且 在 其 中 
分 配 了 q[])。 只 有 当 i 变 成 728 时 ，q[i] 才 引用 不 同 页 上 的 地 址 。 在 这 种 情况 下 ， 它 就 是 我 们 不 具 
有 写 权限 (或 任何 其 他 权限 〉 的 页 ;虚拟 内 存 便 件 检测 到 这 一 点 ， 并 触发 一 个 段 错误 。 

由 于 每 个 整数 变量 都 存储 在 4 学 节 中 ， 因 此 这 个 页 包含 S28 (2112/40 个 额外 的 “ 约 影 ”元 素 ， 
代码 将 它 作 为 属于 数组 q[] 对 符 。 因 此 ， 虽 然 我 们 没有 打算 让 它 这 样 处 理 ， 但 是 访问 q[26e8]， 
q[261]… 一 直到 元 素 199+5$18=727， 即 q[727] 仍 然 是 合法 的 ， 不 会 触发 段 错 误 ! UH AE UI WI 
q[728] 时 才 会 遇 到 新 页 ， 你 可 能 有 也 可 能 没有 对 它 的 必需 访问 权限 。 这 里 ， 我 们 不 具有 对 该 页 的 
访问 权限 ， 因 此 发 生 了 段 错误 。 然 而 ， 下 一 个 页 可 能 侥幸 具有 指定 给 它 的 恰当 权限 ， 然 后 还 会 有 
更 多 幻影 数组 元 素 。 

总 结 : 正如 早先 所 介绍 的 ， 不 能 根据 没有 发 生 段 错误 来 得 出 结论 认为 内 存 操作 是 正确 的 。 
41.6 ” 段 错 误 与 Unix 信 和 号 

在 上 面 的 讨论 中 ， 我 们 说 段 错误 一 般 会 导致 程序 的 中 止 。 昌 然 这 是 正确 的 ， 但 是 想 要 认真 彻 
底 地 调试 ， 还 应 该 了 解 有 关 Unix 信 和 号 的 内 容 。 

fe (signal) 表示 在 程序 执行 期 间 报 告 的 异常 情况 ， 人 允许 操作 系统 〈 或 程序 员 上 自己 的 代码 ) 
反映 多 种 事件 。 信 和 号 可 能 在 某 个 进程 上 由 系统 的 底层 硬件 抛 出 〈SIGSEGV 或 SIGFPE)， 或 者 由 操作 
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系统 抛 出 〈《SIGTERM 或 SIGABRT)， 或 者 由 另 一 个 进程 抛 出 〈SIGUSR1 或 SIGUSR2 )， 甚 至 可 能 由 该 进 
程 本 身 发 送 (通过 raise() 库 调用 )。 

最 简单 的 信号 示例 为 : 当 程 序 正 在 运行 时 按 下 键盘 上 的 Ctrl+C 组 合 键 。 按 下 〔〈 或 释放 ) 键盘 
上 的 任何 键 ， 都 会 生成 导致 操作 系统 例 程 运行 的 硬件 中 断 。 当 按 下 Ctrl+C 组 合 键 时 ， 操 作 系 统 认 
出 这 种 键 组 合 是 一 个 特殊 模式 ， 并 为 控制 终端 上 的 进程 抛 出 一 个 名 为 SIGINT 的 信和 号。 通常 的 说 法 
是 操作 系统 “ 回 进 程 发送 一 个 信号 ”。 我 们 将 采用 这 种 说 法 ， 但 是 重要 的 是 要 意识 到 实际 上 没有 
任何 内 容 “ 发 送 ” 给 进程 。 所 友 生 的 事情 只 不 过 是 操作 系统 将 信号 记录 到 进程 表 中 ， 以 便 下 次 进 
程 接收 信号 时 得 到 CPU 上 的 时 间 片 ， 执 行 恰当 的 信号 处 理 程 序 ， 下 面 将 会 解释 。( 然 而 ， 假 设 有 
紧急 信号 ， 操 作 系 统 也 可 能 会 决定 让 接收 进程 的 下 一 个 时 间 所 稍 早 于 其 他 进程 。) 

一 个 进程 上 可 以 发 出 很 多 种 不 同 的 信号 。 在 Linux 中 ， 可 以 通过 在 shell 提 示 符 后 面 键入 如 下 
代码 来 列 出 全 部 的 信号 。 























man 7 signal 











言 号 的 定义 有 多 种 标准 ， 比 如 POSIX.1， 这 些 信 号 会 出 现在 所 有 兼容 的 操作 系统 上 。 还 有 个 
别 操作 系统 独 有 的 信号 。 

每 个 信号 都 有 自己 的 信号 处 理 程序 ， 这 是 当 进 程 友 出 特定 信号 时 调用 的 函数 。 回 到 我 们 的 
Ctrl+C 示 例 中 ， 当 发 现 SIGINT 时 ， 操 作 系统 将 进程 的 当前 指令 设置 在 该 特定 信和 号 的 信和 号 处 理 程序 
的 开端 。 因 此 ， 妆 进程 恢复 时 ， 它 会 执行 该 处 理 程序 。 

每 种 类 型 的 信号 有 一 个 默认 信号 处 理 程序， 除非 实在 需要 ， 否则 束 不 必 亲 日 编写 信号 处 理 程 
序 。 默 认 情 况 下 ， 忽 略 大 多 数 无 害 信 和 号。 有些 类 型 的 信号 较 严 重 ， 比 如 违反 内 存 访 问 权 限 产生 的 
言 号 ， 表 示 出 现 了 程序 不 能 或 不 应 继续 执行 的 情况 。 在 这 样 的 情况 下 ， 默 认 信 和 号 处 理 程 序 会 直接 
终止 程序 。 

虽然 有 些 信 号 处 理 程序 不 能 被 重 写 , 但 是 在 很 多 情况 下 可 以 编写 目 己 的 处 理 程序 来 芋 换 操作 
系统 提供 的 默认 处 理 程 序 。 在 Unix 下 就 可 以 用 signal() 或 sigaction() 两 个 系统 调用 。2 例如， 你 
的 目 定 义 处 理 程序 函数 可 以 忽略 信号 ， 甚 全 可 以 要 求 用 户 选择 一 个 做 法 。 

为 了 增加 趣味 性 ， 我 们 编号 了 一 个 程序 来 说 明 如 何 编写 目 己 的 处 理 程序 ， 并 使 用 signal() 
调用 或 重 写 默认 操作 系统 处 理 程 序 ， 或 者 忽略 信和 号。 我 们 选择 了 SIGNIT， 但 是 可 以 对 可 被 捕获 的 
任何 信号 做 相同 的 事情 。 该 程序 还 演示 了 如 何 使 用 raise()。 












































#include «signal.h» 
#include <stdio.h> 


void my sigint handler( int signum ) 


{ 


CD 有 两 个 函数 可 用 来 重 写 默认 信号 处 理 程序 ， 因 为 和 其 他 Unix 系 统一 样 ，Linux 也 遵循 多 个 标准 。signal() 函 数 比 
sigaction() 更 容易 使 用 ， 它 遵循 ANSI 标 准 ; 而 sigaction( ) 函 数 较 复杂 ， 但 是 也 更 多 样 化 ， 它 遵循 POSIX 标 准 。 








100 — $43*X FAKA 


printf("I received signal Xd (that's 'SIGINT' to you). Mn", signum); 
puts("Tee Hee! That tickles! Wn"); 


int main(void) 


{ 


char choicestrl20]; 


int choice; 


while ( 1 ) 

i 
puts("1. Ignore control-C"); 
puts("2. Custom handle control-C"); 
puts("3. Use the default handler control-C"); 
puts("4. Raise a SIGSEGV on myself."); 
printf("Enter your choice: "); 

» 5 in) 


( : 
\ 3 
sscanf(choicestr, "Xd", &choice); 


if ( choice == 1 ) 
signal(SIGINT, SIG IGN); // Ignore control-C 
else if ( choice -- 2 ) 
Signal(SIGINT, my sigint handler); 
else if ( choice -- 3 ) 
signal(SIGINT, SIG DFL); 
else if ( choice == 4 ) 
raise(SIGSEGV); 


Ale 
ELSE 


puts("Whatever you say, guv'nor.\n\n"); 


return 0; 


} 


当 程 序 违反 内 存 访问 权限 时 ,在 进程 上 发 出 SIGSsEGV 信 号。 默认 段 错误 处 理 程 序 终止 该 进程 ， 
并 向 磁盘 上 写 一 个 “核心 文件 ”( 很 快 会 介绍 )。 

如 果 希 望 保持 程序 有 效 ， 而 不 是 允许 程序 被 终止 ， 则 可 以 为 sSIGSEGV 编 写 一 个 自 定义 处 理 
程序 。 事 实 上 ， 有 时 可 能 要 故意 导致 段 错误 ， 以 便 使 某 种 工作 得 以 完成 。 例 如 ， 有 些 并 行 处 理 
软件 包 使 用 人 为 段 错 误 ， 会 有 特殊 处 理 程序 啊 应 这 种 错误 以 保持 系统 各 个 环节 之 间 的 一 致 性 ， 
4.3 市 将 会 介绍 。 第 7 莉 将 介绍 sSIGSEGV 的 一 些 专 用 处 理 程序 的 为 一 类 用 途 , 涉及 检测 段 错误 并 优 
雅 地 做 出 反应 的 一 些 工具 。 
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然而 ， 使 用 GDB/DDDV/Eclipse 时 ， 目 定义 信和 号 处 理 程序 可 能 会 使 程序 变 复杂 。 无 论 是 直接 使 
用 还 是 通过 DDD GUI， 每 当 发 出 任何 信号 时 ，GDB 都 会 停止 进程 。 在 刚刚 提 到 的 类 似 于 并 行 处 
理 软件 应 用 程序 中 , 这 意味 着 GDB 会 因为 与 调试 工作 无 关 的 原因 而 非常 频繁 地 停止 。 为 了 处 理 这 
种 情况 ， 需 要 使 用 handle 命 令 告诉 GDB 在 某 些 信号 发 生 时 不 要 停止。 


4.1.7 ”其 他 类 型 的 异常 


除了 段 错误 以 外 , 还 有 一 些 其 他 原因 也 会 导致 月 泪 。 浮 点 异 第 (Floating-point exception, FPE) 
导致 发 出 SIGFPE 信 和 号。 虽然 这 个 信号 被 称 为 “ 浮 点 ”异常 ， 但 是 它 也 包括 整数 算术 下 音 ， 比 如 洲 
出 和 除 以 0 的 情况 。 在 GNU 和 BSD 系 统 上 ， 传 递 给 FPE 处 理 程序 的 第 二 个 参数 指出 了 FPE 的 原因 。 
默认 处 理 程序 在 有 些 情 况 下 (比如 浮 点 洲 出 ) 将 忽略 SITGFPE， 在 另外 一 些 情况 下 《比如 整数 除 以 
0) 则 终止 进程 。 
当 CPU 在 执行 机 和 右 指令 期 间 在 总 线 上 检测 到 反 委 情况 时 , 会 发 生 总 线 错 误 。 不同 的 架构 对 忌 
线 上 发 生 的 事情 有 不 同 的 要 求 ， 这 种 反 锅 的 确切 原因 取决 于 具体 的 架构 。 导 致 总 线 错误 的 部 分 情 
况 举 例如 下 。 
a 访问 不 存在 的 物理 地 址 。 这 不 同 于 段 错 误 ， 段 错误 涉及 访问 不 具备 和 足 够 权限 的 内 存 。 段 
错误 是 权限 的 问题 ， 总 线 错误 则 是 由 于 提供 给 处 理 右 的 是 无 效 地 址 。 
a 在 很 多 架构 上 ， 要 求 访问 32 位 量 的 机 器 指令 要 求 字 对 齐 ， 即 这 个 量 的 内 存 地 址 必须 是 4 的 
倍数 。 导 致 试图 在 奇数 号 地 址 上 访问 具有 4 字 节 的 数 的 指针 错误 可 能 会 引起 总 线 错 误 。 
在 x86 架 构 上 运行 Linux 时 ， 下 面 这 个 程序 不 会 引起 总 线 错 误 ， 因 为 这 些 处 理 器 未 对 齐 的 内 
存 地 址 也 是 合法 的 ， 它 们 只 是 执行 起 来 比 对 章 访问 慢 而 已 。 
int main(void) 
{ 


char «char ptr; 


int xint ptr: 
A = i up" m3 
























































int int arrayl2]; 


// char ptr points to first array element 
char ptr - (char x) int array; 


// Causes int ptr to point one byte past the start of an existing int. 


usr basta 4 IC 
ff STILE dll Lik Cail & be UVIILY. Vie VY Le, lit pur to I 


int ptr = (int *) (char ptr«1); 








*int ptr = 1; // And this might cause a bus error. 
return 0; 
j 
JGWE WIPE OL, PIE ce db laser, T EUn R AI SIGBUS{a 7. BAWA UL 


下 ，SIGBUSs 会 导致 进程 转 储 核心 并 立即 终止 。 
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42 核心 文件 


正如 前 面 所 提 到 的 ， 有 些 信号 表示 让 某 个 进程 继续 是 不 妥当 ， 甚 至 是 不 可 能 的 。 在 这 些 情 况 
中 ， 默 认 动作 是 提前 终止 进程 ， 并 编写 一 个 名 为 核心 文件 〈core file) 的 文件 ， 俗 称 转 储 核心 。 
你 的 shell 可 能 会 禁止 编写 核心 文件 (参见 4.2.2 节 了 解 详 细 信 息 )。 

如 果 在 程序 运行 期 间 创建 了 核心 文件 ， 则 可 以 对 该 文件 打开 调试 器 (比如 GDB)， 然 后 开始 
常规 GDB 操 作 。 


4.2.1 核心 文件 的 创建 方式 


核心 文件 包含 程序 朋 尝 时 对 程序 状态 的 详细 摘 述 : 栈 的 内 容 〈 或 者 ， 如 果 程 序 是 多 线程 的 ， 
则 是 各 个 线程 的 栈 )，CPU 寄 存 器 的 内 容 《〈 同 样 ， 如 果 程 序 是 多 线程 的 ， 则 是 每 个 线程 上 的 一 组 
寄存 吉 值 )， 程 序 的 静态 分 配 变 量 的 值 〈 全 局 与 static 变 量 )， 等 等 。 

创建 核心 文件 非常 容易 。 下 和 面 是 生成 这 样 文件 的 代码 清单 4-1。 


代码 清单 4-1  abort.c 


int main(void) 
abort(); 












































return 0; 


j 


abort() 函 数 导 至 当前 进程 接收 sIGABRT 信 号 ，SIGABRT 的 默认 信号 处 理 程 序 终 止 程序 并 转 储 
核心 。 代 码 清单 4-2 是 男 一 个 转 储 核心 的 简短 程序 。 在 这 个 程序 中 ， 我们 故意 解除 对 NULL 指 针 的 
引用 。 


代码 清单 4-2  sigsegv.c 


int main(void) 

{ 
char *c = 0; 
printf("%s\n", *c); 








return 0; 


} 
让 我 们 生成 一 个 核心 文件 。 编 详 并 运行 sigsegvc。 


$ gcc -g -W -Wall sigsegv.c -0 sigsegv 
$ ./sigsegv 
Segmentation fault (core dumped) 


如 果 列 出 当前 目录 ， 将 注意 到 一 个 名 为 core〈 或 者 其 变 体 ) 的 新 文件 。 当 在 文件 系统 中 的 某 
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处 看 到 一 个 核心 文件 时 ， 可 能 不 能 立即 分 辨 出 是 哪个 程序 生成 它 鸭 。Unix 命 令 file 有 助 于 指出 转 
储 这 个 特定 核心 文件 的 可 执行 文件 的 名 称 。 
$ file core 


core: ELF 32-bit LSB core file Intel 80386, version 1 (SYSV), SVR4-style, 
SVR4-style, from 'sigsegv' 


核心 文件 命名 约定 
过 去 ， 核 心 文件 的 命名 约定 比较 简单 : 它们 都 称 为 core。 
后 来 ， 在 GNU/Linux 下 ， 多 线程 程序 开始 用 core.3928 这 样 的 文件 名 来 转 储 核心 ， 其 中 数字 
部 分 表示 转 储 核心 的 进程 ID。 
从 Linux 2.5 内 核 起 , 可 以 使 用 /proc/sys/kernel/ 接 口 控制 核心 文件 的 名 称 . 这 个 机 制 很 简单 ， 
完好 地 用 文档 记录 在 Linux 内 核 源 树 下 的 Documentation/sysctl/kernel.txt 中 ，。 


4.2.2 ”有 东 些 shell 可 能 禁止 创建 核心 文件 

很 多 情况 下 ， 调 试 过 程 都 不 涉及 核心 文件 。 如 果 程 序 发 生 了 段 错误 ， 程 序 员 只 要 打开 调试 器 ， 
比如 GDB， 并 再 次 运行 程序 就 可 以 重建 该 错误 。 由 于 这 个 原因 ， 而 且 因 为 核心 文件 可 能 比较 大 ， 
所 以 大 多 数 现代 shell 都 会 在 一 开始 束 防 止 编写 核心 文件 。 

在 bash 中 ， 可 以 使 用 ulimit 命 令 控制 核心 文件 的 创建 。 


ulimit -c n 


其 中 n 是 核心 文件 的 最 大 大 小 ， 以 干 学 市 为 持 位 。 超 过 nKB 的 任何 核心 文件 都 不 会 被 编写 。 如 果 
没有 指定 nr，shell 就 会 显示 核心 文件 上 的 当前 限制 。 如 采 人 允许 任意 大 小 的 核心 文件 ， 可 以 使 用 : 


ulimit -c unlimited 


对 于 tcsh 和 和 csh 用户 ，1imit 命 令 控制 核心 文件 大 小 。 例 如 ， 
































limit coredumpsize 1000000 


告诉 shell， 如 果 核 心 文件 大 小 大 于 1 000 000 字 节 ， 则 不 创建 该 文件 。 

如 果 在 运行 sigsegv 后 没有 得 到 核心 文件 ， 对 于 bash 使 用 ulimit -c 检 查 当 前 核心 文件 的 限制 ， 
对 于 tcsh 或 csh 则 使 用 1imit -c 检 查 。 

为 什么 需要 首先 有 核心 文件 呢 ? 既然 可 以 简单 地 在 GDB 中 重 狐 运行 具有 段 错误 的 程序 , 并 重 
建 段 错误 ， 为 什么 要 那么 腑 烦 地 创建 核心 文件 呢 ? 答 案 是 在 有 些 情况 下 ， 比 如 在 下 和 面 的 情况 下 ， 
这 种 假设 是 不 成 立 的 。 

a 只 有 在 运行 了 一 段 长 时 间 后 才 发 生 段 错误 ， 所 以 在 调试 喜 中 无 法 重新 创建 该 钳 误 。 

a 程序 的 行为 取决 于 随机 的 环境 事件 ， 因 此 再 次 运行 程序 可 能 不 会 再 现 段 错 误 。 

a 当 新 手 用 户 运 行程 序 时 发 生 的 段 错 误 。 这 里 的 用 户 ， 通 和 不 是 程序 员 〈 也 不 具有 对 源 代 
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人 码 的 访问 权限 )， 不 会 进行 这 种 调试 。 然 而 ， 为 了 检查 和 调试 ， 这 样 的 用 户 可 能 仍然 会 同 
程序 员 发 送 核心 文件 《如 有 果 可 以 创建 这 种 文件 的 话 ) 。 
然而 要 注意 ， 如 宋 程 序 的 源 代 人 码 不 可 用 ,或 者 可 执行 文件 不 是 用 增强 的 符号 表 编 详 的 ， 其 或 
当 我 们 没有 计划 调试 可 执行 文件 ， 核 心 文件 可 能 都 不 会 有 太 大 的 用 处 。 


4.3 扩展 示例 


本 玉 提 供 一 个 调试 段 错误 的 详细 示例 。 

下 面 是 一 些 C 代 人 码 ， 可 能 是 类 似 于 C++ 学 符 串 的 托管 学 符 串 类 型 的 实现 部 分 。 源 文件 cstring.c 
中 包含 的 代码 ， 实 现 一 种 称 为 cstring 的 类 型 ， 然 而 ， 该 代码 充 满 了 或 明 或 暗 的 程序 错误 。 我 们 
的 目标 是 找 出 所 有 这 些 程 序 错误 并 纠正 它们 。 

CSstring 是 如 下 这 种 结构 的 别名 : 包含 指 问 char 字 符 串 的 存储 空间 的 指针 ， 以 及 一 个 字符 串 
长 度 的 变量 。 我 们 实现 了 一 些 适 用 于 处 理 字 符 串 的 实用 函数 。 

O Init_Cstring(): 采用 老式 的 C 字 符 串 作为 一 个 实 参 ， 并 用 筷 来 初始 化 新 CString。 

D Delete CString(): Cstrings 是 在 推 上 分 配 的 ， 当 不 再 需要 时 ， 必 须 释 放 它 们 的 内 存 。 这 

个 函数 负 贡 无 用 单元 收集 。 

O Chomp(): 删除 和 返回 CString 的 最 后 一 个 学 符 。 

QO Append Chars To CString(): 将 C 样 式 的 字符 串 附 加 到 cstring 后 面 。 

最 后 ，main() 是 测试 CString 实现 的 驱动 函数 。 

本 节 的 代码 使 用 了 一 个 极其 有 用 的 库 函 数 snprintf()。 万 一 你 还 没有 遇 到 过 这 个 函数 ， 不 明 
FETA. SM: 它 基 本 上 类 似 于 printf()， 只 是 这 个 函数 将 其 输出 写 到 字符 数组 
中 ， 而 不 是 写 到 stdout 中 。 为 了 帮助 防止 缓冲 区 溢出 《在 任何 复制 以 空 字 符 结 尾 的 字符 串 的 函数 
中 ， 如 条 衬 宇 符 被 留 在 源 字 人 符 串 之 外 没有 复制 ， 则 可 能 发 生 这 种 流出 )，snprintf() 还 可 以 指定 
要 写 的 最 大 学 节 数 量 ， 包 括 拖 尾 的 空 字符 。 

#include <stdio.h> 

#define STRSIZE 22 
























































int main(void) 

{ 
char s1[] = "brake"; 
char *S2 = "breakpoints"; 
char logo[STRSIZE ] ; 


Falc d ee y 


snprintf(logo, STRSIZE, "5c 4s 4d 5s. , 1 , S1, 2*2, S2); 


puts (logo); 
return 0; 
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这 个 程序 会 将 字符 串 “Ibrake 4breakpoints”《〔〈 我 的 碎 了 4 个 断 点 ) 写 到 字符 数组 1ogo 中 ， 准 
备 打 印 到 一 张 保险 杠 贴纸 上 。 

下 面 是 我 们 的 cstring 的 实现 。 

#include <stdio.h> 


#include <stdlib.h> 
#include <string.h> 


typedef struct { 
char *str; 


int len; 

} CString; 

CString «Init CString(char xstr) 

{ 
CString *p = malloc(sizeof(CString)); 
p->len = strlen(str); 
strncpy(p-»str, str, strlen(str) + 1); 
return p; 

} 





void Delete CString(CString xp) 
{ 

free(p); 

free(p-»str); 


// Removes the last character of a CString and returns it. 


char lastchar = *( cstring->str + cstring->len); 
// Shorten the string by one 

*( cstring->str + cstring->len) = '0'; 
cstring->len = strlen( cstring->str ); 


return lastchar; 


// Appends a char * to a CString 
// 
CString *Append Chars To CString(CString *p, char *str) 
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1 
char «newstr = malloc(p-»len + 1); 
p->len = p-»len + strlen(str); 
// Create the new string to replace p->str 
snprintf(newstr, p->len, "%s%s", p-»str, str); 
// Fxee old string and make CString point to the new string 
free(p-»str); 
p-»str - newstr; 
return p; 
} 
int main(void) 
{ 
CString «mystr; 
char c; 
mystr - Init CString("Hello!"); 
printf("Init:\n str: ‘%s' len: %d\n", mystr-»str, mystr-»len); 
= Chomp(mystr); 
printf("Chomp ‘%c':\n str: Xs' len: %d\n", c, mystr-»str, mystr->len); 
mystr - Append Chars To CString(mystr, " world!"); 
printf("Append:\n str: ^Xs' len: %d\n", mystr-»str, mystr->len); 
Delete CString(mystr) ; 
return 0; 
} 


研究 该 代码 并 猜 一 下 输出 应 是 什么 。 然 后 编 详 并 运行 它 。 


$ gcc -g -W -Wall cstring.c -o cstring 
$ ./cstring 
Segmentation fault (core dumped) 


HW I T 我 们 需要 做 的 第 一 件 事 是 找 出 这 个 段 错 误 是 在 何 处 发 生 的 。 然 后 可 以 试看 解释 
Sy fl Za PSAP NY BUEN. 

在 继续 讲述 之 前 提 一 下 ， 我 们 隔壁 办 公 室 的 同事 Milton 也 在 尝试 修复 该 程 序 中 的 错误 。 与 我 
们 不 同 的 是 , Milton 不 知道 如 何 使 用 GDB, 因此 他 打算 打开 Wordpad, 在 代码 中 到 处 插入 对 printf() 
的 调用 ， 并 重新 编译 程序 ， 试 网 指出 段 错误 在 何 处 发 生 。 让 我 们 看 看 我 们 对 程序 的 调试 是 不 是 比 
Milton 快 。 

Milton 用 Wordpad， 我 们 则 用 GDB 分 析 核 心 文件 。 




















$ gdb cstring core 
Core was generated by "cstring'. 


43 扩展 示例 111 


Program terminated with signal 11, Segmentation fault. 
#0 0x400a9295 in strncpy () from /lib/tls/libc.so.6 


(gdb) backtrace 


#0 0x400a9295 in strncpy () from /lib/tls/libc.so.6 
#1 Ox080484df in Init CString (str=0x80487c5 "Hello!") at cstring.c:15 
#2  0x080485e4 in main () at cstring.c:62 





根据 回溯 输出 ， 段 错误 发 生 在 第 1$ 行 的 Init_CSstring() 中 ， 是 在 调用 strncpy() 期 间 发 生 的 。 
甚至 不 需要 仔细 奉 看 代 但 ， 我 们 已 经 知道 很 可 能 我 们 在 第 1$ 行 上 同 strncpy() 传 递 了 一 个 NULL 指 
针 。 

这 时 ，Milton 仍 然 在 犹 驳 应 该 在 何 处 插入 第 一 个 对 printf() 的 调用 呢 。 
4.3.1 第 一 个 程序 错误 

GDB 指 出 , 段 错误 发 生 在 第 1$ 行 的 Init_CSstring() 中 , 因此 将 当前 帧 改 为 调用 Init_CSstring() 
EA) AS Ht 


(gdb) frame 1 
#1 Ox080484df in Init CString (str=0x80487c5 "Hello!") at cstring.c:15 
15 strncpy(p->str, str, strlen(str) + 1); 























我 们 将 这 样 应 用 确认 原则 : 通过 查看 传递 给 strncpy() 的 各 个 指针 参数 ( 即 str、p 和 p->str)， 
依次 确认 它们 的 值 与 我 们 预想 的 一 样 。 首 先 输出 str 的 值 : 


(gdb) print str 
$1 - 0x80487c5 "Hello!" 


由 于 str 是 指针 ， 因 此 GDB 给 我 们 的 值 是 十 六 进 制 地 址 ex8e487c5。 由 于 str 是 char 的 指针 ， 
因此 是 字符 串 的 地 址 ，GDB 很 够 朋友 地 告诉 我 们 字符 串 的 什 :“Hello!” 虽 然 从 上 和 面 的 回 亢 输出 中 
可 以 看 到 这 是 很 明显 的 ， 但 是 我 们 无 论 如 何 应 检 和 奉 一 下 。 因 此 ，str 不 是 NULL， 它 指 同一 个 有 效 

FHF, BA BALE HEK o 

现在 让 我 们 将 注意 力 转移 到 其 他 指针 参数 ，p 和 p->str。 

(gdb) print *p 

$2 - ( 

str = 0x0, 
len = 6 
j 


问题 现在 很 明显 : p->str, 它 也 是 指 辣 字符 串 的 指针 ， ZENULL. MURER RAL 2E T: 
我 们 试图 写 入 到 内 存 中 的 位 置 0， 而 这 个 位 置 对 于 我 们 是 禁区 
但 是 什么 能 导致 p->str (该 结构 下 cstring 中 的 字符 串 指针 为 NULL? 再 看 看 代位 。 
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(gdb) list Init CString 


5 typedef struct { 

6 char xstr; 

了 int len; 

8 j CString; 

g 

10 

11 CString «Init CString(char xstr) 

12 1 

13 CString «p - malloc(sizeof(CString)); 
14 p-»len - strlen(str); 

15 strncpy(p-»str, str, strlen(str) + 1); 
16 return p; 

17 Í 

18 














我 们 看 到 在 发 生 段 错误 的 代码 行 前 面具 有 两 行 代码 , 它们 之 间 的 第 13 行 很 可 能 是 问题 根源 所 
在 。 

我 们 将 从 GDB 中 重新 运行 程序 ,在 进入 Init_CSstring() 的 入 口 处 设置 一 个 临时 断 点 ， 并 逐 行 
单 步调 试 这 个 函数 ， 碍 看 p->str 的 值 。 

(gdb) tbreak Init CString 


Breakpoint 1 at Ox804849b: file cstring.c, line 13. 
(gdb) run 











Breakpoint 1, Init CString (str-0x80487c5 "Hello!") at cstring.c:13 


13 CString «p = malloc(sizeof(CString)); 
(gdb) step 

14 p-»len - strlen(str); 

(gdb) print p-»str 

$4 - OxO 

(gdb) step 

15 strncpy(p-»str, str, strlen(str) + 1); 








问题 在 这 里 : 我 们 打算 提交 一 个 段 错误 ， 因 为 下 一 行 代 码 解 除 对 p->str 的 引用 ，p->str 仍 然 
为 NULL。 现 在 我 们 使 用 小 灰 单 元 格 来 判断 发 生 了 什么 。 

当 为 p 分 配 内 存 时 ， 我 们 获得 了 存放 struct 的 足够 内 存 : 一 个 存放 字符 串 地 址 的 指针 ， 以 及 
一 个 存放 字符 串 长 上 度 的 int 变 量 。 但 是 我 们 没有 分 配 存 放 字 人 符 串 本 映 的 内 存 。 我 们 犯 了 个 和 常见 的 
Hw: 声明 了 指针 ， 却 没有 声明 将 指针 指 问 任何 对 象 ! 我 们 需要 做 的 事 首先 是 分 配 足够 的 内 存 来 
存放 str， 然 后 使 p->str 指 问 刚 刚 分 配 的 内 存 。 下 和 面 是 这 件 事 的 做 法 (我 们 需要 在 学 符 串 的 长 有 
上 加 1， 因 为 strlen() 没 有 将 末尾 的 '\e@' 统 计 在 内 )。 


CString «Init CString(char *str) 
i 
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// Allocate for the struct 
CString «p - malloc(sizeof(CString)); 
p-»len - strlen(str); 


// Allocate for the string 

p->str = malloc(p-»len + 1); 
strncpy(p->str, str, strlen(str) + 1); 
return p; 


j 


IE DE— F, Milton WIEST A printf() va FADER Rr. ENRE mE. "UE 
ISA tA, WES ACHE AAR RE ST BR. WRAAE, TASA SUIS S printf () iii. 
4.3.2 ”在 调试 会 话 期 间 不 要 退出 GDB 

在 调试 会 话 期 间 ， 修 改 代码 时 永远 不 要 退出 GDB。 前 面 说 过 ， 这 样 就 不 必 费 时 间 来 启动 ， 可 
以 保留 我 们 的 断 点 ， 等 等 。 

类 似 地 ， 我 们 要 保持 文本 编辑 器 打开 。 在 调试 时 的 两 次 编译 之 间 留 在 同一 个 编辑 器 会 话 中 ， 
我 们 可 以 充分 利用 编辑 嚣 的“ 撤销” 功能。 例如， 调试 过 程 中 的 一 个 常见 策略 是 临时 删除 部 分 代 
但 ， 以 便 集 中 精力 研究 你 认为 存在 错误 的 余下 部 分 。 完 成 检查 后 ， 只 要 使 用 编辑 器 的 撤销 功能 恢 
复 被 删除 的 代码 行 即 可 。 

因此 ， 在 屏幕 上 我 们 通常 有 一 个 GDB (或 DDD) 窗口 ， 以 及 一 个 编辑 器 窗口 。 我 们 还 打开 
了 第 三 个 窗口 用 于 执行 编译 器 命令 ， 甚 至 最 好 是 通过 编辑 器 执行 命令 。 例 如 ， 如 果 使 用 的 是 Vim 
编辑 器 ， 可 以 执行 如 下 命令 ， 它 会 保存 所 做 的 编辑 修改 ， 并 在 同时 重新 编译 程序 。 























: make 


(我们 还 假定 在 Vim 局 动 文 件 中 使 用 set autowritei íi J VimMJautowritee =. WRA, 
Vim 的 功能 也 会 将 光标 移 到 报告 的 第 一 个 编译 警告 或 错误 处 ， 可 以 通过 Vim 的 :cnext 和 :cprev 命 
令 在 多 个 编译 错误 中 来 回调 试 。 当 然 ， 如 果 使 用 这 些 命令 的 简短 别名 放 到 Vim 局 动 文件 中 ， 所 有 
这 些 操作 将 更 方便 。) 

4.3.3 ”第 二 个 和 第 三 个 程序 错误 

当 修 复 了 第 一 个 程序 错误 后 ， 再 次 从 GDB 中 运行 程序 。《〈 记 住 ， 当 GDB 注 意 到 重新 编译 了 
程序 后 ， 它 会 目 动 加 载 新 的 可 执行 文件 ， 因 此 同样 不 需要 退出 和 重 局 GDB。) 

(gdb) run 

The program being debugged has been started already. 


Start it from the beginning? (y or n) y 
"cstring' has changed; re-reading symbols. 























Starting program: cstring 


Init: 
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str: Hello!' len: 6 
Chomp '': 
str: Hello!O' len: 7 
Append: 
str: 'Hello!O world' len: 14 


Program exited normally. 
(gdb) 


Chomp() 中 似乎 有 两 个 问题 。 第 一 ， 它 应 加 上 一 个 感叹 号 '!1'， 但 是 看 上 去 它 加 上 的 是 非 打 印 
字符 。 第 二 ，0 字 符 出 现在 我 们 的 学 符 串 来 尾 。 由 于 Chomp() 是 查找 这 些 程序 错误 的 明显 地 方 ， 因 
此 我 们 将 局 动 该 程序 ， 并 在 Chomp() 的 入 口 处 放置 一 个 临时 断 点 。 

(gdb) tbreak Chomp 

Breakpoint 2 at 0x8048523: file cstring.c, line 32. 


(gdb) run 
Starting program: cstring 











Init: 
str: "Hello!' len: 6 


Breakpoint 1, Chomp (cstring-0x804a008) at cstring.c:32 
32 char lastchar = *( cstring->str + cstring-»len); 


(gdb) 

该 字符 串 的 最 后 一 个 字符 应 该 是 '! 。 让 我 们 确认 一 下 。 

(gdb) print lastchar 

$1 = 0 '\0' 

BTU lastcharze'!', (AS bee PAF. A EKA REET “A” (offby 
one) R.o ERIRE EXA H. a AZU RAS Bs BP SFB o 

pointer offset: 0123456 


cstring->str: Hello! eo 
string length: 123456 


这 个 字符 串 的 最 后 一 个 字符 存储 在 地 址 cstring->str+5 上 ， 但 是 因为 该 字符 串 长 度 是 字符 计 
数 ， 而 不 是 索引 ， 因 此 地 址 cstring->str + cstring->len 指 问 最 后 一 个 字符 后 面 的 一 个 数组 位 置 ， 
在 这 个 位 置 上 是 以 NULL 结 束 , 而 不 是 我 们 希望 它 指 问 的 位 置 。 这 个 问题 可 以 修复 , 方法 是 将 如 下 代码 : 









































char lastchar = *( cstring->str + cstring-»len); 


改 为 : 


char lastchar = *( cstring-»str + cstring-»len - 1); 
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这 部 分 代码 中 隐藏 了 第 三 个 程序 错误 。 当 调用 chomp() 后 ， 字符 串 “Hello!” 变 成 “Hello!@” 
(不 是 “hello”)。 在 GDB 中 要 执行 的 下 一 行 〈 第 33 行 ) 是 要 缩短 衬 符 串 的 地 方 ， 方 法 是 使 用 结 
尾 的 空 字符 蔡 换 其 最 后 一 个 字符 。 

*( cstring-»str + cstring-»len) = '0'; 

我 们 很 快 发 现 这 一 行 里 包含 了 我 们 刚刚 在 第 31 行 修复 过 的 同样 问题 : 错误 地 引用 了 学 符 串 的 
最 后 一 个 字符 。 而 且 ， 由 于 我 们 的 眼睛 已 经 适应 这 行 代 码 ， 因 此 似乎 我 们 在 该 位 置 人 存储 字符 "8 7， 
它 不 是 空 字 待 。 我 们 的 意思 是 将 '\@' 放 在 字符 串 的 末尾 。 进 行 了 这 两 处 纠正 后 ， 第 33 行 为 : 
































*( cstring-»str + cstring-»len - 1) = '\0'; 

xxr, RH St Miltonfii Hprintf()2€30 STS Behan, FF AMM YEInit CString() F 
纠正 了 内 存 分 配 问 题 。 他 没有 继续 前 进 找到 我 们 刚刚 在 Chomp() 中 修复 的 程序 错误 ， 而 是 不 得 不 
将 所 有 对 printf() 的 调用 部 去 挥 ， 并 重新 编 详 程序 。 他 真 索 ! 
4.3.4 ”第 四 个 程序 错误 

根据 上 一 节 的 讨论 我 们 进行 一 些 纠正 ， 重 新 编 诺 代码， 并 再 次 运行 程序 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 

















Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: Hello world' len: 12 
Program received signal SIGSEGV, Segmentation fault. 
Oxb7fo8dai in free () from /lib/tls/libc.so.6 


(gdb) 


XU PA Bet Ye s C Ds BA DO BE T E Jes te 2D c IC ICI, B PEE VH. HI B6 Ee oct 
Append Chars To CString() 中 。 可 以 使 用 一 个 简单 的 backtrace 来 确认 或 否认 这 种 假设 。 

1 (gdb) backtrace 

e #0 Ooxb7f08da1 in free () from /lib/tls/libc.so.6 


s #1 0x0804851a in Delete CString (p=0x804a008) at cstring3.c:24 
4 #2 0x08048691 in main () at cstring3.c:70 


(gdb) 


As da pe y] HI SS — 4T AL, 我 们 的 假设 是 错误 的 : 程序 实际 上 在 Delete CString) P Ji. 
XX JEANS dI ]HEAppend Chars To Cstring() P B EB FEX. Ae SEB VAT A Ber 
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关 程 序 错误 在 Delete_CSstring() 中 。 这 正 是 这 里 使 用 GDB 检 得 我 们 预期 的 原因 一 一 完全 省 略 了 奉 
找 在 何 处 发 生 段 错误 的 工作 。 一 旦 我 们 那 位 使 用 printf() 的 朋友 在 调试 时 赶 到 这 里 ,他 一 定 会 将 
追 踩 代码 放 在 错误 的 函数 中 ! 

科 而 ，Delete_CSstring() 较 短 ， 因 此 应 该 能 很 快 发 现 错误 所 在 。 


(gdb) list Delete CString 
20 

















21 void Delete CString(CString xp) 
22. 4 

23 free(p); 

24 free(p-»str); 

235 ] 

26 


我 们 首先 释放 p, 然后 释放 p->str。 这 是 一 个 不 太 难 发 现 的 错误 。 当 释放 p 后 , 不 能 保证 p->str 
还 能 指 问 内 存 中 的 正确 位 置 ， 它 可 能 指 癌 任何 位 置 。 当 这 个 “任何 位 置 ” 是 我 们 不 能 访问 的 内 存 
时 ， 就 会 引起 段 错 误 。 修 复方 法 是 逆转 对 free() 的 调用 顺序 。 


void Delete CString(CString *p) 
1 











free(p-»str); 
free(p); 
j 


ME Bk — P. Milton Ze 22 WERE 341 146 2168 EN Chomp () P E fis EP TAY RRE. Ur EAR 
打 电 话 问 我 们 求助 。 
4.8.5 ”第 五 个 和 第 六 个 程序 错误 

我 们 纠正 、 重 新 编 详 ， 并 再 次 运行 代码 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 








Init: 
str: "Hello!' len: 6 
Ba 
str: Hello' len: 5 
Append: 
str: “Hello world’ len: 12 


Program exited normally. 
(gdb) 
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在 附加 操作 以 后 ， 字 和 人 符 串 中 丢失 了 惊叹 号 ， 本 来 应 当 是 "Hello world!" FAKE, SKET 
符 串 是 错误 的 ， 但 报告 的 字符 串 长 度 12 却 是 正确 的 。 碍 找 这 个 程序 错误 的 最 符合 馆 辑 的 位 置 在 
Append Chars To CString()H, PAI HE AE AS RC 7S BT A o 


(gdb) tbreak Append Chars To CString 

Breakpoint 3 at 0x8048569: file cstring.c, line 45. 
(gdb) run 

Starting program: cstring 


























Init: 

str: ^"Hello!' len: 6 
Chomp '!': 

str: Hello’ len: 5 


Breakpoint 1, Append Chars To CString (p=0x804a008, str=0x8048840 " world!") 


at cstring.c:45 
45 char *newstr = malloc(p-»len + 1); 


C 字 符 串 newstr 震 要 足够 大 ， 以 便 同 时 存放 p->str 和 str。 我 们 看 到 ， 在 第 4$ 行 对 malloc() 
的 调用 没有 分 配 足 够 的 内 存 , 它 仪 仅 分 配 了 够 放 p->str 和 一 个 结尾 衬 字 人 符 的 空间 。 第 45$ 行 应 改 为 : 





char *newstr = malloc(p-»len + strlen(str) + 1); 


当 进 行 了 这 种 纠正 并 重新 编 详 后 ， 得 到 如 下 输出 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 


Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: "Hello world’ len: 12 
xx — AERA TE S Uu eee ie. RRRA EREA “GERI EER” o 
没 错 : 它 确实 是 一 个 程序 错误 ， 它 没有 作为 段 错误 出 现 ， 纯 粹 是 一 种 运气 。 其 余 程 序 错误 很 有 可 
能 仍然 在 Append_Chars_To_CSstring() 中 ， 因 此 我 们 在 那里 设置 另 一 个 断 点 。 























(gdb) tbreak Append Chars To CString 
Breakpoint 4 at 0x8048569: file cstring.c, line 45. 
(gdb) run 


Starting program: cstring 
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(gdb) run 
Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 


Breakpoint 1, Append Chars To CString (p=0x804a008, str=0x8048840 " world!") 
at cstring.c:45 


45 char *newstr = malloc(p-»len + strlen(str) + 1); 
(gdb) step 
46 p->len = p-»len + strlen(str); 

















PATER SATAR RPA BAS ER, 字符 串 长 度 却 是 正确 的 : 加 号 正确 地 计算 了 
p->str 与 str 连 接 起 来 的 长 上 度 。 这 里 没有 问题 了 ， 因 此 可 以 继续 下 一 步 。 


(gdb) step 
49 snprintf(newstr, p-»len, "%s%s", p-»str, str); 


下 一 行 代码 (第 49 行 ) 是 我 们 形成 新 字符 串 的 地 方 。 我 们 预期 在 这 一 步 后 newstr 会 包含 "hello 
world!"。 让 我 们 应 用 确认 原则 来 验证 这 一 点 。 

(gdb) step 

51 free(p->str); 


(gdb) print newstr 
$2 = Ox804a028 "Hello world" 


第 51 行 上 代码 构造 的 学 符 串 中 缺少 了 惊叹 号 ,因此 程序 错误 可 能 太 生 在 第 49 行 , 但 会 是 什么 
错误 呢 ?” 在 对 snprintf() 的 调用 中 ， 我 们 请 求全 多 将 p->len 字 市 都 复制 人 天 newstr 中 。p->len 的 值 
被 确认 为 12， 下 一 个 "Hello world!1" 有 12 个 字符 。 我 们 没有 让 snprintf() 复 制 原 字符 串 中 的 结尾 
空 字符 。 然 而 ， 本 来 以 为 会 得 到 一 个 畸 型 字符 串 ， 最 后 一 个 位 置 有 司 叹 号 ， 没 有 了 衬 字 符 ， 但 实 
际 上 并 非 如 此 。 

这 是 snprintf() 的 出 色 之 处 。 它 总 是 将 结尾 宇 字 符 复 制 到 目标 字符 串 中 。 如 采 你 偷懒 ， 指 定 
复制 的 最 多 字符 数 小 于 原 字 符 串 中 实际 字符 数 〈( 正 如 我 们 这 里 所 做 的 )，snprintf() 就 会 复制 它 
能 够 复制 的 尽 可 能 多 的 字符 , 但 写 入 目标 字符 串 的 最 后 一 个 字符 肯定 是 空 学 从 。 为 了 修复 我 们 的 
音 误 ， 需 要 让 snprintf() 复 制 足够 的 学 世 以 存放 源 字 符 串 的 文本 和 结尾 空 字 人 符 。 

因此 需要 修改 第 4$ 行 。 下 面 是 完整 的 修复 后 函数 。 


CString «Append Chars To CString(CString xp, char *str) 
{ 










































































char «newstr = malloc(p->len + strlen(str) + 1); 
p->len = p->len + strlen(str); 


// Create the new string to replace p->str 


43 扩展 示例 119 


snprintf(newstr, p-»len + 1, "%s%s", p->str, str); 
// Free old string and make CString point to the new string 
free(p-»str); 


p-»str - ense 

return p; 
i 
让 我 们 重新 编 详 修复 后 的 代码 ， 并 运行 程序 。 
(gdb) run 


"cstring' has changed; re-reading symbols. 
Starting program: cstring 


Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: "Hello world!' len: 12 





Program exited normally. 
(gdb) 


看 上 去 不 错 ! 

虽然 我 们 涵盖 了 很 多 领域 ， 并 遇 到 了 一 些 比较 难 的 概念 ， 但 这 是 值得 的 。 即 使 我 们 的 含 程序 
错误 的 CString 实现 有 点 做 作 ， 但 我 们 的 调试 会 话 是 相当 实用 的 ， 包 括 了 调试 的 很 多 方面 : 

O 确认 原则 ; 

O 使 用 核心 文件 进行 衣 演 进程 的 “ 死 后 ”分 析 ; 

a 纠正 、 编 译 并 重新 运行 程序 ， 甚 至 不 需要 退出 GDB; 

O printf() 风 格调 试 的 不 足 之 处 ; 

O 利用 你 的 智慧 ， 这 虽然 原始 ， 却 是 无 可 符 代 的 。 

如 果 你 过 去 是 用 printf() 风 格调 试 的 ， 丈 会 及 现 使 用 printf() 跟 踪 某 些 程序 错误 会 有 多 难 。 
虽然 在 调试 中 不 可 避免 地 会 使 用 printf() 诊 断代 码 ， 但 是 作为 一 种 通用 目的 的 “工具 ”， 它 远 远 
不 足以 用 来 跟踪 实际 代码 中 发 生 的 大 部 分 程序 错误 。 



































多 活动 上 下 文中 的 调试 











SFE SUIS SERAL AARS, MAEN 
WO) 只有 挑战 人 性。 客户/ 服务 器 网 络 编程 、 多 线程 编程 ， 以 及 并 行 处 理 ， 都 属于 这 种 情况 。 
本 章 将 概述 最 常用 的 多 路 编程 技术 ， 并 提供 一 些 方法 和 技巧 处 理 这 些 类 型 的 程序 中 的 错误 ， 着 重 
介绍 调试 过 程 中 GDB/DDD/Eclipse 的 用 法 。 
5.1 调试 客 尸 /服务 器 网 络 程 序 

计算 机 网 络 是 极其 复杂 的 系统 , 网 络 化 软件 应 用 程序 的 精确 调试 有 时 需要 使 用 硬件 监控 来 收 
集 关于 网 络 通信 量 的 详细 信息 。 单 就 这 种 调试 主题 ， 就 足以 写 一 本 书 。 我 们 这 里 的 目标 只 是 简单 
地 介绍 一 下 这 一 主题 。 

我 们 的 示例 由 下 面 的 客户 /服务 器 对 组 成 。 用 户 可 以 通过 客户 机 应 用 程序 检查 运行 服务 器 应 
用 程序 机 器 上 的 负荷 ， 即 使 用 户 没有 服务 器 所 在 机 器 的 账户 也 可 以 。 客 户 机 通过 网 络 连接 向 服务 
器 发 送 查询 信息 的 请 求 (这 里 是 通过 Unix 的 w 命 令 查询 服务 器 所 在 系统 上 的 负荷 )。 然 后 服务 器 处 
理 该 请 求 并 返回 结果 ， 捕 获 w 的 输出 ， 并 将 它 通过 网 络 连 接 发 送 回 客户 机 。- 一 般 来 说 ， 一 个 服务 
器 可 以 接受 来 自 多 个 远程 客户 机 的 请 求 ， 为 了 让 示例 简单 一 点 ， 我 们 假设 只 有 一 个 客户 机 

服务 器 的 代码 如 下 所 示 。 


1 // SIVI.C 





















































3 // a server to remotely run the w command 
+ // user can check load on machine without login privileges 


if usage: SVI 


#include <sys/types.h> 


#include «svs/socket.h» 


2y2 


{ 
7  #include <stdio.h> 
8 


1  #include «netinet/in.h» 
n #include «netdb.h» 

w #include «fcntl.h» 

13 #include <string.h> 
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1u  #include <unistd.h> 
is #include <stdlib.h> 


17 #define WPORT 2000 
is #define BUFSIZE 1000 // assumed sufficient here 


s; int clntdesc, // socket descriptor for individual client 
21 svrdesc; // general socket descriptor for server 


23 Char outbuf[BUFSIZE]; // messages to client 


s void respond() 
了 ant fd nh: 


26 [ ie 

27 

o8 memset(outbuf,O,sizeof(outbuf));  // clear buffer 

99 system("w > tmp.client"); // run 'w' and save results 
30 fd = open("tmp.client",O RDONLY) ; 

3] nb = read(fd,outbuf,BUFSIZE); // read the entire file 
32 write(clntdesc,outbuf,nb);  // write it to the client 

33 unlink("tmp.client");  // remove the file 

34 close(clntdesc); 

s Jj 


37 int main() 
ss (1 struct sockaddr in bindinfo; 





40 // create socket to be used to accept connections 
al svrdesc = socket(AF INET,SOCK STREAM, O); 

42 bindinfo.sin family - AF INET; 

43 bindinfo.sin port - WPORT; 

44 bindinfo.sin addr.s addr - INADDR ANY; 

4 bind(svrdesc,(struct sockaddr *) &bindinfo,sizeof(bindinfo)); 
46 

47 // OK, listen in loop for client calls 

48 listen(svrdesc,5); 

49 

50 while (1) { 

51 // wait for a call 

52 clntdesc = accept(svrdesc,0,0); 

53 // process the command 

54 respond(); 

55 } 

m } 


下 面 是 客户 机 的 代码 。 
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1 // clnt.c 


»  // usage: clnt server machine 


s  #include <stdio.h> 

6 #include <sys/types.h> 
; #include «sys/socket.h» 
s #include «netinet/in.h» 
v  #include «netdb.h» 

i0. finclude <string.h> 

u #include <unistd.h> 


is #define WPORT 2000 // server port number 
4 #define BUFSIZE 1000 


is int main(int argc, char **argv) 
5; { int sd,msgsize; 


19 struct sockaddr in addr; 
20 struct hostent xhostptr; 
ə char buf|[BUFSIZE]; 


23 // create socket 

94 sd = socket(AF INET,SOCK STREAM, 0); 
35 addr.sin family - AF INET; 

36 addr.sin port - WPORT; 


27 hostptr - gethostbyname(argv[1]); 

28 memcpy(&addr.sin addr.s addr,hostptr->h addr list[0],hostptr->h length); 
3€ 

30 // OK, now connect 

T connect(sd,(struct sockaddr *) &addr,sizeof(addr)); 


33 // xead and display response 
34 msgsize = read(sd,buf,BUFSIZE); 


ab if (msgsize > 0) 

36 write(1,buf,msgsize); 
37 printf("\n"); 

38 return 0; 

x0 I 


HF AAAS Fe PAR SS REED RTA PEE 

服务 器 代码 的 第 41 行 上 创建 了 一 个 套 接 字 〈socket)， 这 是 一 种 类 似 于 文件 描述 符 的 抽象 ， 正 
如 人 们 使 用 文件 描述 符 在 文件 系统 对 象 上 执行 1O 操 作 一 样 ， 人 们 通过 套 接 字 向 网 络 连接 读 写 信 
恩 。 在 第 45 行 上 ， 套 接 字 与 特定 的 端口 号 绑 定 ， 随 机 地 选择 为 2000 写 端口 。( 像 本 例 这 样 的 用 户 
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级 别 的 应 用 程序 只 能 使 用 1024 以 上 的 端口 号 。) 这 个 数字 标识 了 服务 器 所 在 系统 上 的 “邮箱 ” 客 
户 机 要 让 这 个 特定 应 用 程序 处 理 的 请 求 发 送 到 该 邮箱 。 

在 第 48 行 上， 服务 器 通过 调用 1isten() 来 “开张 营业 ”。 然 后 在 第 52 行 上 通过 调用 accept() 
等 待 客户 机 请 求 进入 。 在 接收 到 一 个 请 求 之 前 ， 该 调用 会 阻塞 。 然 后 它 返 回 一 个 新 的 套 接 字 来 与 
客户 机 通信 。( 当 有 多 个 客户 机 时 ， 原 来 的 套 接 字 继续 接收 新 请 求 ， 甚 至 有 可 能 同时 服务 现 有 请 
求 ， 因 此 需要 单独 的 套 接 字 。 所 以 需要 按 多 线程 风格 实现 服务 器 。 ) 服务 器 使 用 respond() 函 数 处 
理 客户 机 请 求 ， 通 过 本 地 调用 w 命 令 来 将 机 器 负荷 信息 发 送 给 客户 机 ， 并 在 第 32 行 将 结果 写 到 套 
接 字 中 。 

在 第 24 行 上 ， 客 户 机 创建 一 个 套 接 字 ， 然 后 在 第 31 行 使 用 这 个 套 接 字 与 服务 器 的 端口 2000 
连接 。 在 第 34 行 上 ， 读 取 服 务 器 发 送 的 负荷 信息 ， 然 后 显示 输出 。 

客户 机 的 输出 如 下 所 示 。 


$ clnt laura.cs.ucdavis.edu 
13:00:15 up 13 days, 39 min, 7 users, load average: 0.25, 0.13, 0.09 






































USER TY FROM LOGIN@ IDLE JCPU PCPU WHAT 

matloff :0 - 14Jun07 ?xdm? 25:38 0.15s -/bin/tcsh -c / 
matloff pts/1 :0.0 14Jun07 17:34 0.46s 0.46s -csh 

matloff pts/2 :0.0 14Jun07 18:12 0.39s 0.39s -csh 

matloff pts/3 :0.0 14Jun07 58.00s 2.18s 2.01s /usr/bin/mutt 
matloff pts/4 :0,0 14Jun07 0.00s 1.85s 0.00s clnt laura.cs.u 
matloff  pts/5 :0.0 14Jun07 20.00s 1.88s 0.02s script 

matloff  pts/7 2040 19Jun07 4days 22:17 0.16s -csh 














现在 假设 程序 员 忘 记 在 客户 机 代码 中 编写 第 26 行 , 这 一 行 指定 服务 器 的 系统 要 连接 到 的 端口 。 
addr.sin port = WPORT; 


VERAT BUR ADHERE TAS EUER RE SIC ER V e 
客户 机 的 输出 现在 是 : 


$ clnt laura.cs.ucdavis.edu 








$ 


hh PDAS ti TZ th AE AAN fe s EH BC AS n eee PULLS e P JE AS ol 
的 ， 或 者 服务 器 和 客户 机 上 都 有 原因 。 

让 我 们 使 用 GDB 检 碍 一 下 。 首 先 ， 确 认 客 户 机 成 功 地 连接 到 了 服务 左 。 在 调用 connect() 时 
设置 一 个 断 点 ， 并 运行 程序 。 

(gdb) b 31 

Breakpoint 1 at 0x8048502: file clnt.c, line 31. 


(gdb) r laura.cs.ucdavis.edu 
Starting program: /fandrhome/matloff/public html/matloff/public html/Debug 
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/Book/DDD/clnt laura.cs.ucdavis.edu 


Breakpoint 1, main (argc-2, argv-0xbf81a344) at clnt.c:31 
31 connect(sd,(struct sockaddr *) &addr,sizeof(addr)); 


fEHIGDB$AfTconnect(), HAA MRR TF SK EME 


(gdb) p connect(sd,&addr,sizeof(addr) ) 
$1 = -1 


iR AEE ZAR -1. RE OR CHEN, EDT TES EY ae, I3 
编写 客户 机 代码 时 ， 会 检 全 connect() 的 返回 值 ， 并 处 理 连接 失败 的 情况 。) 

顺便 说 一 下 ， 注 意 在 手工 执行 对 connect() 的 调用 时 ， 必 须 去 挥 这 种 类 型 强制 转换 ， 如 果 保 
留 了 这 样 的 类 型 强制 转换 ， 将 会 得 到 下 和 面 的 错误 消 轧 。 


(gdb) p connect(sd,(struct sockaddr *) &addr,sizeof(addr)) 
No struct type named sockaddr. 


XXE HT GDBHHEAREIS] PRAHA, 因为 我 们 在 程序 其 他 地 方 没有 使 用 过 这 个 结构 ,所 以 
抛 出 了 这 条 错误 。 

还 要 注意 ， 如 果 GDB 会 话 中 的 connect() 成 功 了 ， 磺 不 能 继续 前 进 并 执行 第 31 行 。 试 图 打开 
己 经 打开 的 套 接 字 是 一 个 错误 。 

刚才 可 以 跳 过 第 31 行 ， 直 接 来 到 第 34 行 。 可 以 使 用 GDB 的 jump 命 令 做 这 件 事 ， 执 行 jump 34, 
但 是 一 般 而 言 应 当 慎 用 这 个 命令 ， 因 为 它 可 能 导致 跳 过 一 些 代 人 码 下 一 步 需 要 的 机 需 指 令 。 因 此 ， 
如 采 连 接 答 试 成 功 ， 最 好 重新 运行 程序 。 

下 和 面 通 过 检查 调用 connect() 时 的 实 参 addr 来 笠 试 跟踪 失败 的 原因 。 

(gdb) p addr 






































connect(3, {sa family-AF INET, sin port-htons(1032), 
sin addr-inet addr("127.0.0.1")), 16) = -1 ECONNREFUSED (Connection refused) 





从 上 面 的 代码 可 以 看 出 ， 值 htons(1632) 指 示 端 口 2032〈 见 下 面 )， 而 不 是 我 们 预期 的 2000。 这 
说 明 有 可 能 错误 地 指定 了 端口 , 或 者 是 根本 未 记 了 指定 端口 。 检 查 一 下 , 很 快 会 发 现 是 后 一 种 情况 。 

再 次 ， 在 源 代码 中 增加 帮助 调试 过 程 的 机 制 (比如 检查 系统 调用 的 返回 值 ) 时 要 谨慎 。 男 一 
个 有 用 的 步 又 是 包括 如 下 代码 行 : 

















#include «errno.h» 
在 我 们 的 系统 上 ， 这 行 代码 创建 了 一 个 全 局 变量 errno， 它 的 值 可 能 从 代码 中 或 者 GDB 中 输出 。 


(gdb) p errno 
$1 = 111 
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对 照 文 件 /usr/include/linux/errno.h， 发 现 这 个 错误 人 码 表示“ 连接 被 拒绝 ”和 错误。 

然而 ，errno 库 的 实现 可 能 根据 平台 的 不 同 而 不 同 。 例 如 ， 头 文件 可 能 有 不 同 的 名 称 ， 或 者 
errno 可 能 被 作为 宏 调 用 实现 ， 而 不 是 作为 变量 实现 。 

另 一 个 方法 是 使 用 strace， 跟 踩 程 序 做 过 的 所 有 系统 调用 。 




















$ strace clnt laura.cs 


connect(3, (sa family-AF INET, sin port-htons(1032), 
sin addr-inet addr("127.0.0.1")], 16) = -1 ECONNREFUSED (Connection refused) 











真是 一 举 两 得 。 得 到 的 第 一 个 重要 信息 是 ， 立 即 看 到 有 一 个 ECONNREFUSED 错 误 。 第 二 个 信息 
是 ， 还 看 到 端口 为 htons(1632)， 其 值 是 2032。 通 过 从 GDB 中 执行 类 似 如 下 的 命令 可 以 检查 后 者 
的 值 : 





(gdb) p htons(1032) 





显示 值 为 2032， 显 然 不 是 预期 的 2000。 
在 很 多 情况 下 “无 论 是 否 与 网 络 连 接 )，strace 都 是 检查 系统 调用 结果 的 便捷 工具 。 
再 举 一 例 ， 假 设 不 小 心态 记 了 在 服务 器 代码 中 写 入 客户 机 (第 32 行 )。 








write(clntdesc,outbuf,nb);  // write it to the client 


在 这 种 情况 下 ， 客 户 机 程序 会 挂 起 ， 等 待 没有 得 到 的 响应 。 当 然 ， 在 这 个 简单 示例 中 ， 很 快 
可 以 想到 是 在 服务 器 中 调用 write() 时 出 了 问题 ， 因 为 忘记 了 在 代码 中 写 入 客户 机 。 但 是 在 比较 复 
杂 的 程序 中 ， 原 因 可 能 不 会 这 么 明显 。 在 这 样 的 情况 下 ， 需 要 建立 两 个 同步 GDB 会 话 ， 一 个 用 于 
客户 机 ， 一 个 用 于 服务 器 ， 一 前 一 后 地 单 步调 试 程 序 的 这 两 个 会 话 。 然 后 可 以 发 现 ， 客 户 机 在 连接 
操作 的 某 个 位 置 挂 起 , 等待 服务 器 的 响应 ， 因而 可 以 推断 出 程序 错误 可 能 在 服务 器 中 某 个 位 置 。 然 
后 将 注意 力 集中 在 服务 器 GDB 会 话 上 ， 尝 试 弄 清 楚 它 在 那 时 为 什么 没有 向 客户 机 发 送 响 应 。 

在 真正 复杂 的 网 络 调试 情况 中 ， 可 以 使 用 开源 Ethereal 程 序 跟踪 单个 TCP/IP 分 组 。 
5.2 ”调试 多 线程 代码 

日前 多 线程 编程 变 得 很 流行 。 对 于 Unix， 最 普遍 的 线程 包 是 POSIX 标 准 Pthreads， 因 此 本 节 
将 它 用 于 我 们 的 示例 中 。 其 他 线程 包 的 原理 与 它 相似 。 
5.2.1 ”进程 与 线程 回顾 


现代 操作 系统 使 用 分 时 技术 管理 多 个 运行 程序 ， 对 用 户 来 说 似乎 是 同步 执行 的 。 当 然 ， 如 采 
机 器 上 有 多 个 CPU, 会 有 多 个 程序 真正 同步 运行 。 但 是 为 了 简单 起 见 , 我 们 假设 只 有 一 个 处 理 器 ， 
在 这 种 情况 下 同步 只 是 一 种 表面 现象 。 

操作 系统 将 运行 程序 的 每 个 实例 表述 为 进程 (Unix 术 语 ) 或 任务 (Windows 术 语 )。 因 此 ， 
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同时 执行 的 单个 程序 的 多 个 调用 (例如 vi 文本 编辑 器 的 同步 会 话 ) 是 各 日 独立 的 进程 。 在 只 有 一 
个 CPU 的 机 器 上 ， 进 程 必须 “轮换 ”操作 。 为 了 形象 地 说 明 ， 让 我 们 假定 每 个 “周期 ”〈 称 为 时 
HA) AR REA 3028 

当 一 个 进程 运行 了 30 坚 秒 以 后 ， 便 件 计时 吉 发 出 一 个 中 断 ， 导 致 操作 系统 运行 。 我 们 假定 这 
个 进程 被 列 的 进程 抢占 了 时 间 户 。 操 作 系统 保存 被 中 断 进程 的 当前 状态 ， 因 此 以 后 可 以 恢复 其 状 
态 ， 然 后 选择 可 以 得 到 时 间 片 的 下 一 个 进程 。 这 个 过 程 称 为 环境 切换 ， 因 为 CPU 的 执行 环境 从 一 
个 进程 切换 到 另 一 个 进程 。 这 个 循环 无 限 重 复 。 

轮换 状态 可 能 提前 终结 。 例 如 ， 当 进程 需要 执行 输入 /输出 时 ， 最 终 会 调用 操作 系统 中 的 一 
个 执行 低层 硬件 操作 的 函数 ， 比 如 说 调用 C 库 函数 scanf() 会 导致 进行 Unix OS read() 系 统 调用 ， 
它 需 要 与 键盘 驱动 程序 进行 交互 。 这 样 , 进程 将 它 的 轮换 安排 让 给 操作 系统 , 提前 结束 了 轮换 状态 。 

这 种 情况 说 明了 一 个 问题 ， 给 定 进程 时 间 片 的 调度 是 相当 随机 的 。 用 户 思考 然后 按 下 一 个 键 
所 花 的 时 间 也 是 随机 的 ， 因 此 无 法 预测 下 次 时 间 片 何 时 开始 。 而 且 ， 如 条 调试 的 是 多 线程 程序 ， 
则 不 知道 将 要 调度 的 线程 次 序 ， 这 会 使 调试 更 加 困难 。 

更 细致 地 看 : 损 作 系统 中 有 一 个 进程 表 ， 列 出 了 关于 当前 所 有 进程 的 信息 。 一 般 来 说 ， 每 个 
进程 在 进程 表 中 被 标记 为 Run 状 态 或 Sleep 状态 。 让 我 们 来 看 一 个 示例 ， 其 中 一 个 运行 程序 到 达 需 
要 从 键盘 读 取 输入 的 位 置 。 正 如 刚刚 提 到 的 ， 这 种 情况 会 结束 进程 的 轮换 状态 。 因 为 进程 现在 在 
等 待 JO 完 成 ， 所 以 操作 系统 将 其 标记 为 处 于 Sleep 状态 ， 使 它 无 资格 占用 时 间 片 。 因 此 ， 在 Sleep 
状态 意味 看 进程 被 阻塞 ,等待 某 个 事件 的 发 生 。 当 这 个 事件 最 终 发 生 后 ， 操 作 系 统 会 将 它 在 进程 
表 中 的 状态 改 回 到 Run。 

非 VO 事 件 也 可 以 触发 进程 变 成 Sleep 状 态 。 例 如 ， 如 果 一 个 父 进 程 创建 了 一 个 子 进程 ， 并 调 
用 wait()， 那 么 父 进程 会 阻塞 ， 直 到 子 进程 完成 它 的 工作 并 且 结 束 。 同 样 ， 这 件 事 发 生 的 确切 时 
间 是 无 法 预测 的 。 

而 且 ， 在 Run 状 态 中 并 不 表示 进程 实际 在 CPU 上 执行 ， 相反， 这 仅 意 味 着 它 准 备 运 行 ， 即 
有 资格 获得 处 理 堪 的 时 间 上 请。 一 旦 发 生 了 环境 切换 ， 操 作 系 统 驶 根据 进程 表 从 当前 处 于 Run 状 
态 的 进程 中 选择 一 个 进程 占用 CPU 的 一 个 周期 。 操 作 系统 使 用 这 一 调度 过 程 来 选择 新 的 环境 ， 
保证 任何 给 定 进程 都 能 获得 时 间 片 ,因而 最 终 会 完成 , 但 是 不 承诺 它 会 收 到 哪些 时 间 片 。 因此， 
等 竺 的 事件 发 生 后 ， 睡 眠 进程 真正 “ 醒 来 ”的 确切 时 间 是 随机 的 ， 进 程 完成 的 准确 速 靳 也 是 随 
机 的 。 

线程 与 进程 非常 类 似 ,， 只 是 线程 占用 的 内 存 比 进程 少 , 创建 线程 和 在 两 个 线程 之 间 切 换 所 需 
的 时 间 也 较 少 。 事 实 上， 线程 有 时 被 称 为 “ 轻 量 级 ”进程 ， 根 据 线 程 系统 和 运行 时 环境 ， 它 们 长 
至 可 能 被 作为 操作 系统 的 进程 实现 。 像 使 用 进程 完成 工作 的 程序 一 样 ， 多 线程 应 用 程序 一 般 会 执 
行 一 个 main() 过 程 ， 该 过 程 创建 一 个 或 多 个 子 线程 。 父 线程 main() 也 是 线程 。 

进程 和 线程 之 间 的 主要 区 别 是 : 与 进程 一 样 ， 虽然 每 个 线程 有 日 己 的 局 部 变量 , 但 是 多 线程 
环境 中 父 程序 的 全 局 变量 被 所 有 线程 共享 ， 并 作为 在 线程 之 间 通 信 的 主要 方法 。( 虽 然 也 可 以 在 
Unix 进 程 之 间 共 享 全 局 变量 ， 但 是 这 样 做 不 方便 。) 

在 Linux 系 统 上 ， 可 以 通过 运行 命令 ps axH 来 查看 系统 上 当前 的 所 有 进程 和 线程 。 
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虽然 有 非 抢占 线程 系统 ， 但 是 Pthreads 使 用 的 是 抢占 线程 管理 集 略 ， 程 序 中 的 一 个 线程 可 能 
在 任何 时 候 被 为 一 个 线程 中 断 。 因 此 ， 上 面 揪 述 的 进程 在 时 间 共 至 系统 中 的 随机 性 要 系 ， 同样 出 
现在 多 线程 程序 的 行为 中 。 所 以 ， 使 用 Pthreads 开 发 的 应 用 程序 中 有 些 程序 错误 不 太 容易 重 现 。 
5.2.2 基本 示例 

下 面 介绍 一 个 求 素数 的 简单 示例 , 该 程序 使 用 经 典 的 埃 拉 托 色 尼 利 法 。 要 求 2 一 zx 之 间 的 素数 ， 
站 先 列 出 所 有 这 些 数 子 ， 然后 去 挥 所 有 2 的 倍数 ， 再 去 挥 所 有 3 的 倍数 ， 以 此 类 推 。 最 后 剩 下 的 束 

ı // finds the primes between 2 and n; uses the Sieve of Eratosthenes, 

2  // deleting all multiples of 2, all multiples of 3, all multiples of 5, 


s. // etc.; not efficient, e.g. each thread should do deleting for a whole 
+  // block of values of base before going to nextbase for more 














6  // usage: sieve nthreads n 
7  // where nthreads 
o  #include <stdio.h> 
io #include «math.h» 
n #include <pthread.h> 


is #define MAX N 100000000 
11 #define MAX THREADS 100 


à — // shared variables 

ız int nthreads, // number of threads (not counting main()) 

18 n, // upper bound of range in which to find primes 

19 prime[MAX N«1], // in the end, prime[i] = 1 if i prime, else 0 
20 nextbase; // next sieve multiplier to be used 





ə int work[MAX THREADS]; // to measure how much work each thread does, 
23 // in terms of number of sieve multipliers checked 


ə  // lock index for the shared variable nextbase 
2 pthread mutex t nextbaselock = PTHREAD MUTEX INITIALIZER; 


v8 — // ID structs for the threads 
ə pthread t id[MAX THREADS]; 


si // "crosses out" all multiples of k, from k*k on 
d rvnceenuitíéà3 


ae wat nr 
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33 { int i- 


a5 for (i = k; itk <= n; i++) { 
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prime[ixk] = 0; 


// worker thread routine 
void xworker(int tn) // tn is the thread number (0,1,...) 


int lim, base; 


// no need to check multipliers bigger than sqrt(n) 
lim = sqrt(n); 


do { 
// get next sieve multiplier, avoiding duplication across threads 
pthread mutex lock (&nextbaselock); 
base = nextbase += 2; 
pthread mutex unlock(&nextbaselock); 
if (base <= lim) { 
work[tn]++;  // log work done by this thread 
// don't bother with crossing out if base is known to be 
// composite 
if (prime[base]) 
crossout (base) ; 
j 
else return; 
} while (1); 


main(int argc, char **argv) 


int nprimes, // number of primes found 
totwork, // number of base values checked 
1; 

void *p; 


n = atoi(argv[1]); 
nthreads - atoi(argv[2]); 
for (i = 2; i <= n; i++) 
prime[i] = 1; 

ye 


// get threads started 
for (i = 0; i < nthreads; i++) { 
pthread create(&id[i],NULL,(void *) worker, (void *) i); 


// wait for all done 
totwork - 0; 
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82 for (i = 0; i < nthreads; i++) { 

83 pthread join(id[i],8p); 

84 printf("%d values of base done\n",work[i]); 

85 totwork += work[i]; 

86 } 

87 printf("%d total values of base done\n",totwork) ; 
88 

89 // report results 

90 nprimes = 0; 

91 for (i = 2; i <= n; i++) 

92 if (prime[i]) nprimes++; 

93 printf("the number of primes found was %d\n",nprimes) ; 
94 

of 





这 个 程序 中 有 两 个 命令 行 参 数 ， 一 个 参数 用 来 检 但 素数 范围 上 边界 的 n， 另 一 个 参数 是 表示 
要 创建 的 工作 线程 数量 的 nthreads。 

这 里 的 main() 创 建 工 作 线 程 ， 每 个 工作 线程 是 对 冰 数 worker() 的 一 次 调用 。 这 些 工作 线程 共 
圣 3 个 数据 项 :上边 夫 变量 nx， 指定 要 从 2~n 的 冰 围 内 清除 其 倍数 的 下 一 个 数字 的 变量 nextbase， 
以 及 记录 2 一 7 的 范围 内 的 每 个 数字 是 合 被 消除 的 数组 prime[]。 每 次 调用 反复 地 取得 一 个 尚未 处 
理 的 被 乘 数 base， 然 后 消除 2 一 z 泄 围 内 bpase 的 所 有 倍数 。 创 建 了 工作 线程 后 ，main() 融 使 用 
pthread_join() 等 符 所 有 线程 完成 各 目的 工作 ， 然 后 在 统计 留 下 的 系数 的 数量 后 恢复 程序 ， 并 发 
出 报告 。 报 告 中 不 仪 包括 素数 的 数量 ,而且 包括 每 个 工作 线程 完成 了 多 少 工 作 的 信息 。 在 多 人 处理 
器 系统 上 进行 负载 平衡 和 性 能 优化 时 这 种 评估 很 有 用 。 

worker() 的 每 个 实例 通过 执行 如 下 代码 取得 base 的 下 一 个 值 。 

pthread mutex lock(&nextbaselock); 


base = nextbase += 2; 
pthread_mutex_unlock(&nextbaselock) ; 


这 里 更 新 了 全 局 变量 nextbase， 用 它 来 初始 化 worker() 实 例 的 局 部 变量 base 的 值 ， 然后 ， 工 
作 线 程 删 除数 组 prime[] 中 base 的 倍数 。( 注 意 ， 我 们 在 main() 开 头 束 消除 了 2 的 所 有 倍数 ， 因 而 
仅 需 要 考虑 base 的 奇数 值 。) 

工作 线程 知道 要 使 用 的 base 的 值 后 , 束 可 以 从 共 圣 的 数组 prime[] 中 安全 地 删 去 base 的 倍数 ， 
因为 没有 其 他 工作 线程 会 使 用 这 个 base 值 。 然 而 ， 必 须 将 防护 语句 放 在 base 基 于 的 共 至 变量 
nextbase 的 更 新 操作 周围 《第 26 行 )。 记 住 ， 任 何 工 作 线 程 都 会 被 另 一 个 工作 线程 在 不 可 预测 的 
时 间 抢 占 ， 而 抢占 的 工作 线程 会 在 worker() 的 代码 中 不 可 预测 的 位 置 。 特 别 有 是， 可 能 页 巧 在 如 下 
语句 的 中 间 中 上 断 当 前 工作 线程 : 


base = nextbase += 2; 
而 且 下 一 个 时 间 厂 被 赋予 了 也 执行 这 个 语句 的 为 一 个 线程 。 在 这 种 情况 下 ， 有 两 个 工作 线程 试图 
立即 修改 共享 变量 nextbase， 它 可 能 导致 隐伏 上 且 难 以 重 现 的 程序 错误 。 
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用 防护 语句 将 操作 共享 变量 的 代码 〈( 称 为 关键 部 分 ) 括 起 来 ， 可 以 防止 发 生 这 种 情况 。 对 
pthread_mutex_lock() 和 pthread_mutex_unlock() 的 调用 可 以 确保 基本 只 有 一 个 线程 执行 括 起 
来 的 程序 片段 。 对 这 两 个 函数 的 调用 告诉 操作 系统 ， 只 有 当前 没有 其 他 线程 在 执行 关键 部 分 时 ， 
才 允 许 一 个 线程 进入 这 个 关键 部 分 , 并 且 让 操作 系统 不 要 抢占 该 线程 , 直到 它 完 成 整个 部 分 。( 线 
程 系统 内 部 使 用 锁 变 量 nextbaselock 来 确保 这 种 “ 互 斥 现象 ” ) 

但 是 ， 往 往 太 容易 发 生 这 样 的 情况 : 没有 成 功 地 识别 和 /正确 地 保护 线程 代码 中 的 关键 部 分 。 
让 我 们 看 看 如 何 使 用 GDB 调 试 Pthreads 程 序 中 的 这 种 错误 。 假 设 我 们 和 态 记 包括 下 和 面 这 个 解锁 语句 : 


pthread mutex unlock(&nextbaselock); 


这 样 ， 一 旦 关键 部 分 被 一 个 工作 线程 和 完 进入， 而 男 一 个 工作 线程 在 永久 等 待 锁 被 释放 ， 上 肯定 
会 导致 程序 挂 起 。 但 是 让 我 们 假设 你 不 知道 这 一 点 。 如 何 使 用 GDB 找 出 故障 发 生 的 地 方 呢 ? 

编译 程序 ， 确 保 加 上 了 -1pthread-lm 标 记 ， 以 便 链 接 Pthreads 和 数学 函数 库 〈 调 用 sqrt() 需 
要 后 者 )。 然 后 运行 GDB 中 的 代码 ， 使 n=1686 且 nthreads=2。 

(gdb) r 100 2 

Starting program: /debug/primes 100 2 

[New Thread 16384 (LWP 28653)] 

[New Thread 32769 (LWP 28676)] 

] 


[New Thread 16386 (LWP 28677) 
[New Thread 32771 (LWP 28678) | 


每 次 创建 新 线程 时 ，GDB 孝 会 宣布 一 下 ， 如 上 所 示 。 我 们 很 快 会 市 读者 观察 哪个 线程 在 做 什 




















六 


程序 挂 起 了 ， 通 过 按 下 Ctrl+C 组 合 键 中 断 它 。GDB 会 话 如 下 所 示 。 


(gdb) r 100 2 

Starting program: /debug/primes 100 2 
[New Thread 16384 (LWP 28653)] 

[New Thread 32769 (LWP 28676)] 

[New Thread 16386 (LWP 28677)] 

[New Thread 32771 (LWP 28678)] 


Program received signal SIGINT, Interrupt. 
[Switching to Thread 32771 (LWP 28678)] 
0x4005ba35 in pthread sigsuspend () from /lib/i686/libpthread.so.O 


在 这 种 时 候 ， 关 键 要 知道 每 个 线程 在 做 什么 ， 可 以 通过 GDB 的 info threads 命 令 来 确定 : 


(gdb) info threads 

* 4 Thread 32771 (LWP 28678) 0x4005ba35 in _ pthread sigsuspend () 
from /lib/i686/libpthread.so.O 
3 Thread 16386 (LWP 28677) 0x4005ba35 in pthread sigsuspend () 
from /lib/i686/libpthread.so.O 
2 Thread 32769 (LWP 28676) 0x420db1a7 in poll () from 
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/lib/i686/libc.so.6 
1 Thread 16384 (LWP 28653) 0x4005ba35 in  pthread sigsuspend () 
from /lib/i686/libpthread.so.O 


星 号 表示 当前 在 线程 4 中 。 让 我 们 看 看 那个 线程 是 做 什么 的 。 
(gdb) bt 
HO 0x4005ba35 in pthread sigsuspend () from /lib/i686/libpthread.so.O 
#1 Ox4005adb8 in _ pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 
#2 0x4005d190 in _ pthread alt lock () from /lib/i686/libpthread.so.O 
#3 0x40059d77 in pthread mutex lock () from /lib/i686/libpthread.so.O 
#4 Ox0804855f in worker (tn-1) at Primes.c:49 
H5 0x40059881 in pthread start thread () from /lib/i686/libpthread.so.O 
#6 0x40059985 in pthread start thread event () from 
/lib/1686/libpthread.so.O 


(这 在 Pthreads 的 LinuxThreads 实 现下 是 可 以 做 到 的 ， 但 是 在 其 他 平台 上 不 一 定 起 作用 。) 

从 该 代码 中 看 到 在 帧 3 和 居 4 中 ， 这 个 线程 在 源 代码 的 第 49 行 上 ， 并 且 在 试图 获得 锁 和 进入 天 
键 部 分 。 

pthread mutex lock(&nextbaselock); 


HRE MOH ERREAREN o SER I PU. RAE ACE BUS 
的 情况 并 且 线程 管理 程序 安排 它 获 得 锁 ， 人 否则 这 个 线程 不 会 得 到 任何 时 间 方 。 
其 他 线程 在 做 什么 呢 ? 可 以 通过 切换 到 其 他 任何 线程 然 后 执行 bt 命令 来 检查 该 线程 的 栈 。 


(gdb) thread 3 
[Switching to thread 3 (Thread 16386 (LWP 28677))]#0 0x4005ba35 in 
_ pthread sigsuspend () from /lib/i686/libpthread.so.O0 
(gdb) bt 
HO 0x4005ba35 in _ pthread sigsuspend () from /lib/i686/libpthread.so.O 
#1 Ox400Sadb8 in _ pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 
82 0x4005d190 in pthread alt lock () from /lib/i686/libpthread.so.O 
H3 0x40059d77 in pthread mutex lock () from /lib/i686/libpthread.so.O 
#4 Ox0804855f in worker (tn=0) at Primes.c:49 
#5 0x40059881 in pthread start thread () from /lib/i686/libpthread.so.O 
#6 0x40059985 in pthread start thread event () from 
/lib/ie86/libpthread.so.O 


JA] CUE PAS LTEZRRE. LIBUE SIZE RéAIEMU d tih PIA, SUE Mx HE 
fan i A 4 He AES xe —7 LEE XE HIT EUE BARES tH EIA RAS O3). 

里 然 不 应 有 任何 其 他 工作 线程 , 但 是 调试 的 一 个 基本 原则 是 不 可 以 无 条 件 相 信任 何事 情 , 一 
切 都 必须 检查 。 我 们 现在 通过 检查 其 余 线程 的 状态 来 做 这 件 事 。 你 将 有 发现， 其 他 两 个 线程 现在 是 
非 工 作 线 程 ， 如 下 所 示 。 
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(gdb) thread 2 
[Switching to thread 2 (Thread 32769 (LWP 28676))]#0  Ox420db1a7 in poll 


() 
from /lib/i686/libc.so.6 


(gdb) bt 

#0 Ox420db1a7 in poll () from /lib/i686/libc.so.6 

i1 0x400589de in  pthread manager () from /lib/i686/libpthread.so.O 
#2  0x4005962b in  pthread manager event () from 
/lib/ie686/libpthread.so.O 


因此 线程 2 是 线程 管理 程序 。 它 是 Pthreads 包 的 内 在 线程 。 它 当然 不 是 工作 线程 ， 这 一 点 部 分 
地 确认 了 我 们 对 只 有 两 个 工作 线程 的 预期 。 检 查 线程 1; 

(gdb) thread 1 

[Switching to thread 1 (Thread 16384 (LWP 28653))]#0 0x4005ba35 in 

| pthread sigsuspend () from /lib/i686/libpthread.so.O 

(gdb) bt 

HO 0x4005ba35 in _ pthread sigsuspend () from /lib/i686/libpthread.so.O 

#1 Ox400Sadb8 in pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 

H2  0x40058551 in pthread join () from /lib/i686/libpthread.so.O 

H3  0x080486aa in main (argc-3, argv-Oxbfffe7b4) at Primes.c:83 

H4 0x420158f7 in  libc start main () from /lib/i686/libc.so.6 


发 现 它 是 执行 main() 的 ， 因 此 可 以 确认 只 有 两 个 工作 线程 。 

然而 ， 两 个 工作 线程 都 停止 了 ， 每 个 线程 都 在 等 待 释放 锁 。 难 怪 程 序 挂 起 了 ! 这 样 足以 查 明 
程序 错误 的 位 置 和 性 质 ， 我 们 很 快意 识 到 是 坏 记 了 调用 解锁 函数 。 
5.2.3 BH 

如 果 在 一 开始 没有 意识 到 防护 共享 变量 nextbase 的 必要 性 , 会 发 生 什 么 事情 ? 如 果 在 前 面 的 
示例 中 遗漏 了 解锁 和 加 锁 操 作 ， 会 发 生 什么 情况 ? 

乍 一 看 这 个 问题 ， 可 能 会 以 为 对 程序 的 正确 运行 没有 影响 《〈 即 得 到 精确 的 素数 数量 )， 只 
不 过 可 能 会 由 于 重复 的 工作 而 使 运行 变 悍 〈 即 使 用 base 的 相同 值 多 于 一 次 )。 人 似乎 有 些 线程 会 
重复 其 他 线程 的 工作 ， 如 两 个 工作 线程 恰好 抢夺 nextbase 的 同一 个 值 来 初始 化 它们 的 base 本 地 
副本 。 然 后 ， 有 些 合 数 可 能 最 后 会 被 删 去 两 次 ， 但 是 结果 《〈 即 素数 的 数量 ) 仍然 是 正确 的 。 

但 是 让 我 们 仔细 看 一 下 。 语 名 
































base = nextbase += 2; 
人 至少 编 译 成 两 条 机 器 语言 指令 。 人 例如， 在 运行 Linux 系 统 的 Pentium 机 器 上 使 用 GCC 编译 器 ， 上 面 
的 C 语 句 翻译 成 如 下 汇编 语言 指令 〈 通 过 用 -Ss 选 项 运行 GCC， 然 后 得 看 得 到 的 .文件 来 获得 汇编 


语言 指令 ); 
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addl $2, nextbase 
movl nextbase, “eax 
movl %eax, -8(Xebp) 


该 代码 将 nextbase 递 增 2， 然 后 将 nextbase 的 值 复 制 到 寄存 右 EAX 中 ， 最 后 ， 将 EAX 的 值 复 
制 到 工作 线程 的 栈 中 存储 本 地 变量 base 的 位 置 。 

假设 只 有 两 个 工作 线程 ， 并 有 旦 假设 nextbase 的 值 为 9， 那 么 当前 正在 运行 的 worker() 调 用 的 
时 间 拨 在 执行 如 下 机 占 指 令 后 会 立即 结 


addl $2, nextbase 














该 指令 将 共享 全 局 变量 nextbase 设 置 为 11。 假 设 下 一 个 时 间 卢 给 予 了 worker() 的 另 一 个 调用 ， 它 
恰好 在 执行 那些 相同 的 指令 。 那 么 第 二 个 工作 线程 现在 将 nextbase 递 增 到 13， 使 用 这 个 值 来 设置 
其 局 部 变量 base,， 并 开始 消除 所 有 13 的 倍数 。 最 后 , worker() 的 第 一 个 调用 会 获得 另 一 个 时 间 片 ， 
然后 从 停止 的 地 方 继续 执行 机 器 指令 : 


movl nextbase, %eax 
movl %eax, -8(%ebp) 








当然 ，nextbase 的 值 现在 是 13。 因 此 ， 第 一 个 工作 线程 将 它 的 局 部 变量 base 的 值 设置 为 
13， 并 继续 消除 这 个 值 的 倍数 ， 而 不 是 设置 为 它 在 其 上 一 个 时 间 乒 期 间 设置 的 值 11。 两 个 工 
作 线 程 都 不 会 用 11 的 倍数 做 任何 事 。 最 终 不 仅 量 无 必要 地 重复 了 工作 ， 而 且 忽略 了 必需 的 工 
JE 

如 何 使 用 GDB 发 现 这 样 的 错误 呢 ? xen EAR" upREXedER UI RAAEN. Wt, TRI 
能 猪 测 base 的 值 不 知 何故 有 时 被 跳 过 了 。 为 了 检查 这 一 假设 ， 可 以 在 下 和 面 这 行 代码 后 耐 放置 一 
个 断 点 。 























base = nextbase += 2; 

通过 重复 执行 GDB 的 continue (c) 命 令 ， 并 显示 base 的 值 ， 

(gdb) disp base 
最 终 可 能 确认 base 的 值 真 的 被 跳 过 了 。 

这 里 的 关键 词 是 “可 能 ” 我 们 前 面 讨 论 过 ， 多 线程 程序 的 运行 有 一 定 的 随机 性 。 在 这 个 例 
子 里 ， 有 可 能 出 现 这 种 情况 : 有 时 运行 程序 后 会 出 现 程 序 错误 〈 即 报告 的 素数 太 多 )， 但 是 有 时 
运行 程序 后 又 可 能 得 到 了 正确 的 答案 ! 

然而 ， 对 这 种 问题 没有 很 好 的 解决 方案 。 调 试 多 线程 代码 第 津 需 要 特别 有 耐心 和 创意 。 
5.2.4 ”GDB 线程 命令 汇总 

下 面 是 与 线程 相关 的 GDB 命 令 用 法 汇总 : 

O info threads (给 出 关于 当前 所 有 线程 的 信息 ); 
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Q thread 3 〈 改 成 线程 3 ); 
Q bread 88 thread 3〔 当 线程 3 到 达 源 代码 行 88 时 停止 执行 ); 
O break 88 thread 3 if x==y( 当 线程 3 到 达 产 代码 行 88， 并 有 变量 x 和 ?7 相等 时 停止 执行 )。 


5.25 ”DDD 中 的 线程 命令 


如 图 5-1 所 示 ， 在 DDD 中 选择 Status 一 Threads 会 弹出 一 个 窗口 ， 按 GDB 的 ijnfo threads 方 式 
显示 所 有 线程 。 可 以 单 击 一 个 线程 将 调试 器 的 焦点 切换 到 这 个 线程 上 。 


DDD: /fandrhome/matloff/public html/matloff/public html/Debug/Book/DDD/PrimesThreads.c [ae 


PrimesThreads.c:52 jw © 


3 





j 


// worker thread routine 
void *workerCint tn) ZZ tn is the thread number (0,1,...) 
£ int lim,base; 


// no need to check multipliers bigger than sqrtín) 
lim = sqrt(n); 


t 
// get next sieve multiplier, OM duplication across threa 


thread mutex Lue nl 
ase = nextbas 
DER AAA DER. eben hacselncki: 
if (base <= lim) £ : DDD: Threads 


// composite 
if (prime[base]) [New Thread -1219073120 Q] 
crossout(base); 3 Thread —1219073120 () from libc. so. 6 


了 reac 208583264 i) a WS C252 
else return; 1 Thread -1208579776 () from libc.so.6 
3 while (1); 


mainCint argc, char **argv) 
£ int nprimes, // number of p 
totwork, // number of ba 


void *p; 
[New Thread —1208583264 CLWP 306 
[Switching to Thread —1208583264 


Breakpoint 1, worker (tn-0) at 上 
Cgdb) I 





图 $-1 ”线程 窗口 


最 好 保持 这 个 弹出 窗口 打开 ， 而 不 是 使 用 一 次 束 关 闭 。 这 样 ， 驶 不 必 总 是 在 每 次 要 奉 看 当前 
有 哪些 线程 在 运行 或 者 切换 到 不 同 的 线程 时 都 重新 打开 这 个 窗口 

DDD 中 似乎 没有 办 法 使 上 面 介绍 的 GDB 命 令 break 88 thread à 3 对 特定 线程 WEDA, 
通过 DDD 探 制 台 来 执行 这 样 的 GDB 命 令 。 


5.2.6 Eclipse 中 的 线程 命令 


首先 要 注意 ，Eclipse 创 建 的 默认 make 文 件 不 会 包括 GCC 的 -lpthread 命 令 行 参数 (也 不 包 
括 所 需 的 其 他 任何 特殊 库 的 参数 )。 如 果 你 愿意 ， 可 以 直接 更 改 make 文 件 ， 让 Eclipse 做 这 件 事 
更 容易 。 在 C/C++ 透视 图 中 右 击 项 目 名 ， 单 击 Properties; 选择 C/C++ Build 劳 边 的 三 角形 图 标 ， 
使 其 变 为 下 三 角 ; 选择 Settings 一 Tool Settings; 选择 GCC C Linker 劳 边 的 三 角形 图 标 ， 使 其 成 
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为 下 三 角 ， 再 选择 Libraries 一 Add (后 者 是 绿色 的 加 号 图 标 )， 并 在 -1 后 面 填 上 库 标 志 〈 比 如 ， 
填写 nm 组 成 -Im)。 然 后 构建 项 目 。 

第 1 草 介 绍 过 ，Eclipse 不 断 地 显示 线程 列表 ， 而 不 像 DDD 要 请 求 才 显示 。 而 且 ， 不 需要 像 在 
DDD 中 那样 请 求 回溯 操作 ， 调 用 栈 显示 在 图 $-2 所 示 的 线程 列表 中 。 正 如 上 面 所 介绍 的 ， 我 们 先 
运行 一 会 儿 程序 ， 然 后 单 击 Reswrme 右 边 的 Suspend 图 标 中 断 它 。 线 程 列 表 在 Debug 视 网 中 ,， 它 一 般 
在 屏幕 的 左上 方 , 但 是 这 里 以 展开 的 形式 出 现 , 因为 我 们 单 击 了 Debug 选 项 卡 中 的 Maximize。 (可 
以 单 击 Restore 回 到 标准 布局 。) 











File Edit Navigate Search Run Project Window Help 
TETEE 


滨 € 趾 B xo.gs5ÀbÉiov-ag 





三 pthread join) 0x47d2d4cb 

三 1 main0 /workspace/primes/PrimePipe.c:83 0x080486db 
> af Thread [2] (Suspended) 
> of Thread [3] (Suspended) 


No source available for" kernel vsyscall) " An outline is not available. 


View Disassembly... 








S canal E @ Ts tens] O Men ed = eo: 








图 $-2 ”Eclipse 中 的 线程 显示 


我 们 发 现 ， 中 断 发 生 时 线程 3 正在 运行 ， 它 收 到 一 个 SIGINT 信 号 ， 这 是 中 断 〈CTRL+C) 信 
号 。 我 们 还 看 到 相关 的 系统 调用 通过 pthread_join() 调 用 ， 而 后 者 由 main() 调 用 。 从 该 程序 以 前 
的 情况 来 看 ， 我 们 知道 它 实 际 上 走 主 线程 。 

要 得 看 妃 一 个 线程 的 信息 , 上 只 要 把 该 线程 劳 边 的 图 标点 成 下 三 角形 即 可 。 要 改 成 万 一 个 线程 ， 
单 击 列表 中 为 一 个 线程 对 应 的 项 。 

我 们 可 能 要 设置 仅 适 用 于 一 个 特定 线程 的 断 点 。 要 做 到 这 一 点 ， 必 须 先 等 到 创建 了 该 线程 。 
然后 ， 当 前 面 设 置 的 断 点 暂停 程序 执行 ， 或 者 出 现 上 面 介 绍 的 中 断 时 ， 我 们 用 创建 断 点 条 件 的 方 
式 右 击 断 点 符号 ， 但 是 这 次 选择 的 是 Filtering。 这 时 会 出 现 一 个 次 似 图 5-3 所 示 的 弹出 窗口 。 我 们 
看 到 ， 这 个 断 点 当前 应 用 于 所 有 3 个 线程 。 例 如 ， 如 采 布 望 这 个 断 点 仅 应 用 于 线程 2， 上 只 要 氮 击 其 
他 两 个 线程 项 劳 边 的 复 选 框 取消 即 可 。 
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= 


Actions Restrict to Selected Targets and Threads: 


—— v M gÈ gdb/mi (12/20/07 5:20 PM) (Suspended) 
uP Thread [1] (Suspended 


af? Thread [2] (Suspended: Breakpoint hit.) 


af? Thread [3] (Suspended) 











图 $-3 ”在 Eclipse 中 设置 某 个 线程 特有 的 断 点 


5.3 ”调试 并 行 应 用 程序 

并 行 编程 架构 主要 有 了 两 种 : 共享 内 存 和 消息 传递 。 

术语 共享 内 存 的 确切 含义 是 : 多 个 CPU 都 具有 对 某 些 共同 的 物理 内 存 的 访问 权限 。 在 一 个 
CPU 上 运行 的 代码 与 在 其 他 CPU 上 运行 的 代码 通信 ， 方 法 是 通过 在 这 个 共享 内 存 上 读 写 。 这 与 多 
线程 应 用 程序 中 的 线程 通过 共享 地 址 空间 与 另 一 个 线程 通信 基本 一 样 。( 事 实 上， 多 线程 编程 变 
成 了 为 共享 内 存 系统 编写 应 用 程序 代码 的 标准 方式 。) 

相反 ， 在 消息 传递 环境 下 ， 在 各 个 CPU 上 运行 的 代码 只 能 访问 该 CPU 的 本 地 内 存 ， 它 通过 通 
信 媒 介 上 发 送 称 为 “消息 ”的 字 节 串 来 与 其 他 CPU 上 的 代码 通信 。 通 常 这 是 某 种 网 络 ， 运 用 某 种 
通用 协议 (比如 TCP/IP) 或 者 适用 于 消 县 传递 应 用 程序 的 专门 软件 基础 结构 。 


5.3.1 idR ARA 


本 节 首 先 以 流行 的 MPI (Message Passing Interface) 包 为 例 ， 讨 论 消息 传 递 。 我 们 这 里 使 用 
的 是 MPICH 实 现 ， 但 是 同样 的 原理 也 适用 于 LAM 和 其 他 MPI 实 现 。 
让 我 们 再 来 看 一 个 求 素 数 的 程序 。 


i #include «mpi.h» 





























// MPI sample program; not intended to be efficient; finds and reports 
4 // the number of primes less than or equal to n 


// 
// 
// 
// 
// 
// 


£f 
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Uses a pipeline approach: node 0 looks at all the odd numbers (i.e., 
we assume multiples of 2 are already filtered out) and filters out 
those that are multiples of 3, passing the rest to node 1; node 1 
filters out the multiples of 5, passing the rest to node 2; node 2 
filters out the rest of the composites and then reports the number 
of primes 


the command-line arguments are n and debugwait 


#define PIPE MSG 0 // type of message containing a number to 


// be checked 


#define END MSG 1 // type of message indicating no more data will 


// be coming 


int nnodes, // number of nodes in computation 


n, // find all primes from 2 to n 
me; // my node number 


E. 
= 
mh fede 


t * 

debugwait; // if 1, then loop around until the 
/ debugger has been attached 

MPI Init(&argc,&argv) ; 

n = atoi(argv[1]); 

debugwait - atoi(argv[2]); 


MPI Comm size(MPI COMM WORLD, &nnodes) ; 
MPI Comm rank(MPI COMM WORLD, &me) ; 


while (debugwait) ; 


void nodeo() 


{ 
L 


int i,dummy, 

tocheck; // current number to check for passing on to next node 
for (i = 1; i <= n/2; i+) { 

tocheck = 2 * i + 1; 

if (tocheck > n) break; 

if (tocheck % 3 > 0) 

MPI Send(&tocheck,1,MPTI INT,1,PIPE MSG,MPI COMM WORLD); 

} 


MPI Send(&dummy,1,MPI INT,1,END MSG,MPI COMM WORLD); 


void node1() 
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st { int tocheck, // current number to check from node 0 
52 dummy ; 
53 MPI Status status; // see below 


55 while (1) { 

7 MPI Recv(&tocheck,1,MPI INT,O,MPI ANY TAG, 
57 MPI COMM WORLD, &status); 

58 if (status.MPI TAG -- END MSG) break; 

50 if (tocheck % 5 > 0) 


T MPI Send(&tocheck,1,MPI INT,2,PIPE MSG,MPI COMM WORLD); 


61 } 

m // now send our end-of-data signal, which is conveyed in the 
63 // message type, not the message itself 

64 MPI Send(&dummy,1,MPI INT,2,END MSG,MPI COMM WORLD); 


7 void node2() 

oc { int tocheck, // current number to check from node 1 
69 primecount, 1, iscomposite; 

70 MPI Status status; 


72 primecount = 3; // must account for the primes 2, 3 and 5, which 
75 // won't be detected below 

74 while (1) { 

75 MPI Recv(&tocheck,1,MPI INT,1,MPI ANY TAG, 

76 MPI COMM WORLD, &status); 

7 if (status.MPI TAG -- END MSG) break; 


78 iscomposite - 0; 

79 for (i = 7; ixi <= tocheck; i += 2) 

80 if (tocheck % i == 0) { 

81 iscomposite = 1; 

82 break; 

83 } 

T if (liscomposite) primecount++; 

85 } 

86 printf("number of primes = %d\n",primecount) ; 
v] 


so main(int argc,char *«argv) 
o 1 init(argc,argv); 

7 switch (me) { 

92 case 0:  nodeo(); 

93 break; 

94 case 1: node1(); 

93 break; 
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06 Case 2: node2(); 
97 25 
" MPI Finalize(); 








正如 本 程序 开头 的 注释 所 解释 的 ， 这 里 ， 埃 拉 托 色 尼 算法 〈 找 素数 算法 ) 在 并 行 系统 的 3 个 
节点 上 运行 ， 以 多 通道 的 方式 工作 。 第 一 个 节点 从 奇数 开始 ， 去 挥 所 有 3 的 倍数 ， 让 其 余 值 通过 
包 选 ， 第 二 个 节点 获得 第 一 个 节点 的 输出 ， 并 去 反 所 有 5S$ 的 倍数 ， 第 三 个 节点 获得 第 二 个 节点 的 
和 输出， 去 邱 余 下 的 所 有 非 素数 ， 并 报告 剩 下 的 素数 数量 。 

这 里 ， 通 过 让 每 个 证 点 癌 下 一 个 节点 一 次 传递 一 个 数字 来 获得 流水 线 操作 。( 在 各 条 MPI 消 
县 中 传递 成 组 的 数字 因而 减少 通信 开销 ， 效 率 会 高 得 多 。) 当 癌 下 一 个 节点 发 送 数字 时 ， 节 点 发 
运 PIPE_MsG 类 型 的 肖 居 。 当 节点 没有 更 多 数字 要 友 送 时 ， 会 发 送 一 条 END_MsG 类 型 的 消 居 了 予以 
说 明 。 

作为 这 里 的 一 个 调试 示例 ,假设 我 们 愁 记 了 在 第 一 个 节点 中 包括 后 面 的 通知 ， 即 环 记 了 第 46 
行 代码 的 nodee() 。 


MPI Send(&dummy,1,MPI INT,1,END MSG,MPI COMM WORLD); 


该 程序 会 在 “下 游 ” 市 点 处 挂 起 。 让 我 们 看 看 如 何 跟 踊 这 个 程序 错误 。( 记 住 ， 下 和 面 的 GDB 
会 话 中 有 些 行 号 会 与 上 面 的 代码 清单 中 相差 1。) 

在 系统 的 一 个 节点 上 调用 名 为 mpirun 的 脚本 ， 从 而 运行 MPICH 应 用 程序 。 该 脚本 通过 SSH 在 
各 个 节点 局 动 应 用 程序 。 这 里 我 们 在 一 个 有 3 台 机 右 的 网 络 上 做 这 件 事 ,，3 台 机 器 分 别称 为 太 点 0、 
节点 1 和 节点 2, n 等 于 100。 程序 错误 导致 程序 在 后 两 个 节点 处 挂 起 。 程序 也 在 第 一 个 节点 处 挂 起 ， 
因为 只 有 MPI 程 序 的 所 有 实例 都 执行 了 MPI_FINALIZE() 函 数 之 后 ， 才 有 实例 会 退出 。 

虽然 我 们 打算 使 用 GDB, 但 是 因为 在 这 3 个 市 点 上 都 使 用 了 mpirun 来 调用 应 用 程序 ， 而 不 
是 直接 在 节点 上 运行 它们 ， 因 此 我 们 不 能 直接 运 行 GDB。 然 而 ，GDB 人 允许 使 用 进程 号 动态 地 
将 调试 右 附 加 到 已 经 运行 的 进程 上 上。 因此， 让 我 们 在 节点 1 上 运行 ps 来 确定 正在 执行 应 用 程序 
的 进程 。 













































































$ ps ax 
2755 ? 9 0:00 tcsh -c /home/matloff/primepipe node 1 3 
2776 ? S 0:00 /home/matloff/primepipe nodei 32812 4 
2777 4 S 0:00 /home/matloff/primepipe nodei 32812 4 


MPI 程 序 在 运行 进程 776， 因 此 将 GDB 附 加 到 节点 1 的 程序 上 。 


$ gdb primepipe 2776 
Oxffffeoo2 in ?? () 


AIMEE S A EAE i DE, WS rece SUNT fI A. 
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(gdb) bt 

#0 Oxffffeoo2 in ?? () 

#1 Ox08074a76 in recv message () 

#2  0x080748ad in p4 recv () 

#3  0x0807ab46 in MPID CH Check incoming () 
#4 0x08076ae9 in MPID RecvComplete () 


HE AvNCNLILEL in MDTR DariNatatunn 6/3 
T 3 VAVOUL FU ol ALE dO TU KEL VE/CI T CI YH X / 


#6 Ox0804a29f in PMPI Recv () 

#7 O0x08049ce8 in nodei () at PrimePipe.c:56 

#8 0x08049e19 in main (argc-8, argv=Oxbffffb24) at PrimePipe.c:94 
#9 0x420156a4 in  libc start main () from /lib/tls/libc.so.6 


MTA Bl Be PP E T8561] Rb ERE, SPEC OR ACT HA o 
fe POR, AIMEE T AI (node1() ETARA Seb THES eA HIN. xe MMT ee, 
还 是 已 经 完成 ?可 以 通过 确定 变量 tocheck 的 上 一 个 已 处 理 的 值 来 衡量 进度 。 


(gdb) frame 7 
#7 Ox08049ce8 in nodei () at PrimePipe.c:56 

















56 MPI Recv(&tocheck,1,MPI INT,O,MPI ANY TAG, 
(gdb) p tocheck 
$1 - 97 


说 明 ”需要 先 使 用 GDB 的 frame 命 令 移动 到 nodel1() 的 栈 帧 ， 








这 段 代 人 码 表明 市 把 1 已 执行 结束 , 因为 97 应 当 是 市 反 0 传 递 给 这 个 节操 进行 素数 检 梧 的 最 后 一 
个 数学 。 因 此 ， 目 前 我 们 料 到 从 节操 0 处 会 产生 一 条 END_MSG 类 型 的 消 且 。 程 序 挂 起 这 一 事实 
蜡 示 了 布 点 0 可 能 没有 发 送 这 样 一 条 消息 ， 而 这 又 导致 我 们 检查 它 是 否 具 有 这 样 的 消息 。 按 这 种 
方式 ， 有 望 很 快 找到 程序 错误 ， 原 来 是 因为 不 小 心 漏 描 了 第 46 行 。 

顺便 说 一 下 ， 当 像 上 面 那样 使 用 如 下 命令 : 




















$ gdb primepipe 2776 


调用 GDB 时 ，GDB 的 命令 行 首 先 检查 名 为 2776 的 核心 文件 。 万 一 存在 这 样 的 文件 ，GDB 会 加 载 
这 个 文件 ， 而 不 是 附加 到 目标 进程 后 面 。 另 外 ，GDB 也 有 attach 命 令 。 

在 本 例 中 , 程序 错误 导致 程序 挂 起 ,调试 像 本 例 这 样 的 并 行程 序 的 方法 与 出 现 错误 输出 征兆 
时 的 方法 略 有 不 同 。 例 如 ,假设 在 第 71 行 错误 地 将 primecount 初 始 化 成 了 2 而 不 是 3。 如 果 试 图 采 
用 相同 的 调试 过 程 ,在 每 个 节点 上 运行 的 程序 就 会 很 快 完成 执行 并 退出 , 而 来 不 及 附加 GDB。( 确 
实 ， 可 以 使 用 非常 大 的 n 值 ， 但 是 通常 一 开始 先 用 简单 的 情况 调试 会 更 好 。) 我 们 需要 某 种 可 用 来 
让 程序 等 待 让 我 们 附加 GDB 的 机 制 ， 而 这 正 是 第 34 行 init() 函 数 的 作用 所 在 。 

正如 在 源 代 人 码 中 看 到 的 ，debugwait 的 值 取 自 用 户 提供 的 命令 行 ，1 表 示 等 待 ，2 表 示 不 等 符 。 
如 果 将 debugwait 的 值 指 定 为 1， 那 么 每 次 调用 程序 时 到 达 第 34 行 ， 它 都 会 在 那里 。 这 样 就 为 我 们 
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提供 了 附加 GDB 的 时 间 。 然 后 可 以 跳出 无 限 循环 ， 并 继续 调试 。 下 和 耐 古 在 市 把 0 处 所 做 的 。 


node1:~$ gdb primepipe 3124 


0x08049c53 in init (argc-3, argv-Oxbfffe2f4) at PrimePipe.c:34 


34 while Vid it) s 
(gdb) set debugwait - 

(gdb) c 

Continuing. 





我 们 一 般 都 怕 无 限 循 环 ， 但 是 这 里 为 了 便于 调试 ， 却 故意 建立 了 一 个 无 限 循 环 在 太后 1 和 市 
扩 2 处 做 相同 的 事 迟 ， 在 后 一 个 市 态 上 ， 还 在 继续 调试 之 前 利用 了 在 第 77 行 设置 断 点 的 机 会 。 


[matloff@node3 ^|$ gdb primepipe 2944 

34 while (debugwait) ; 

(gdb) b 77 

Breakpoint 1 at 0x8049d7d: file PrimePipe.c, line 77. 
(gdb) set debugwait - 

(gdb) c 

Continuing. 








Breakpoint 1, node2 () at PrimePipe.c:77 





77 if (status.MPI TAG == END MSG) break; 
(gdb) p tocheck 

$1 - 7 

(gdb) n 

78 iscomposite - 0; 

(gdb) n 

79 for (i = 7; i*i <= tocheck; i += 2) 
(gdb) n 

84 if (liscomposite) primecount++; 

(gdb) n 

75 MPI Recv(&tocheck,1,MPI INT,1,MPI ANY TAG, 
(gdb) p primecount 

$2 - 


这 时 ， 注 意 到 primecount 应 为 4， 而 不 是 3 (7 以 下 的 素数 是 2?、3、5 和 7)， 因 此 找到 了 程序 错 
误 的 位 置 。 
5.3.2 ”共享 内 存 系统 

本 廊 介 绍 共 至 内 存 类 型 的 并 行 编程 情形 。 下 和 面 我 们 将 真正 的 共 侍 内 存 机 占 与 软件 分 布 式 共 诗 
内 存 设置 的 情况 分 开 介 绍 。 


1. 真正 的 共享 内 存 
正如 前 面 所 提 到 的 ， 在 真正 的 共享 内 存 环境 中 ， 通 负 使 用 线程 来 开发 应 用 程序 。5.2 节 介绍 
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的 用 GDB/DDD 调 试 的 内 容 丈 派 上 了 用 场 。 

OpenMP 是 这 样 的 机 器 上 流行 的 编程 环境 。OpenMP 问 程序 员 提 供 了 使 用 线程 的 高 级 并 行 编 

时 结构 。 如 有 必要 ， 程 序 员 仍然 具有 线程 级 的 访问 权限 ,但 是 在 大 多 数 情况 下 ， 程序 员 不 需要 了 

解 OpenMP 指 令 的 多 线程 实现 细 市 。 

$.4 节 将 提供 一 个 关于 调试 OpenMP 应 用 程序 的 扩展 示例 。 

2. 软件 分 布 式 共享 内 存 系统 

虽然 双核 CPU 机 器 现 在 普通 消费 者 也 买 得 起 了 , 但 是 具有 多 个 处 理 器 的 大 型 共 孚 内 存 系统 仍然 
要 人 花 几 十 万 美元 才能 买 到 。 一 种 流行 的 、 不 算 太 贯 的 符 代 品 是 工作 站 网 络 Cnetwork of workstations, 
NOW)。NOW 染 构 使 用 了 可 以 造成 共享 内 存 错觉 的 底层 库 。 应 用 程序 员 基 本 上 不 需要 了 解 这 个 
库 ， 它 主要 从 事 维护 不 同 节 点 之 间 共 享 变 量 的 副本 统一 性 这 样 的 网 络 事务 。 

这 种 方法 称 为 软件 分 布 式 共 享 内 存 (SDSM)。 用 得 最 广泛 的 SDSM 库 是 莱 斯 大 学 (Rice 
University) 开发 并 维护 的 Treadmarks。 另 一 个 优秀 的 软件 包 是 JIAJIA,， 可 以 从 何 田 的 站 点 CAttp:// 
www-users.cs.umn.edu/ ^ tianhe/paper/dist.htm) 下 载 。 

SDSM 应 用 程序 展示 的 某 种 行为 会 打击 粗心 的 程序 员 。 它 们 高 度 依赖 于 特定 的 系统 ， 因 此 这 
里 无 法 给 出 通用 的 对 每 方法 ， 但 是 我 们 将 简要 介绍 其 中 的 一 些 共同 问题 。 

很 多 SDSM 是 基于 页 的 ， 这 意味 看 它们 依赖 于 方 点 上 的 抵 层 虚拟 内 存 便 件 。 虽 然 动作 比较 复 
区 ， 但 是 我 们 可 以 给 出 一 个 快速 概览 。 假 设 要 在 NOW 玫 点 之 间 共 享 变量 X。 程 序 员 是 这 样 表达 这 
个 意图 的 : 对 SDSM 库 进行 菜 个 调用 ， 这 个 库 再 发 出 一 个 UNIX 系 统 调 用 ， 请 求 操 作 系 统 对 于 水 
及 包含 X 的 页 错误 ， 使 用 SDSM 库 中 的 函数 蔡 换 它 目 己 的 段 错 误 处 理 程序 。SDSM 的 工作 方式 是 : 
只 有 有 共有 X 的 有 效 副 本 的 NOW 克 点 才 具 有 标记 为 驻 留 的 对 应 内 存 页 。 当 在 其 他 和 点 上 访问 X 时 ， 
束 会 产生 页 错误 ， 确 层 SDSM 软 件 从 拥有 Xx 的 市 点 处 取得 正确 的 值 。 

同样 地 ， 没 有 必要 知道 SDSM 系 统 的 确切 运作 ; 相反 ， 要 知道 有 一 个 底层 的 基于 虚拟 内 存 的 
机 制 ， 在 维护 各 NOW 节 点 的 共 孚 数据 的 本 地 副本 一 致 性 。 如 采 不 了 解 这 一 点 ， 那 么 当 试 图 调试 
SDSM 应 用 程序 代码 时 可 能 会 丈 二 和 尚 挽 不 看 涉 脑 。 调 试 占 可 能 会 由 于 不 存在 的 段 错误 神秘 地 集 
止 ， 因 为 SDSM 基 础 设施 专门 产生 段 错误 ， 当 SDSM 应 用 程序 在 调试 工具 下 运行 时 ， 调 试 工具 能 
感知 它们 。 总 识 到 这 一 点 后 束 根 本 没有 问题 ,在 GDB 中 ， 当 发 生 这 种 奇怪 的 暂 仿 情况 时 ， 只 要 执 
行 continue 命 令 束 可 以 恢复 执行 。 

每 当 友 生 上段 错 误 时 ， 你 可 能 会 试图 使 用 如 下 GDB 命 令 来 命令 GDB 不 要 停止 ,或 让 它 发 出 


AX. Ae. NE 
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handle SIGSEGV nostop noprint 


不 过 , BAITED ACF BY he BCs Pa DB Pe S DEBE] EEE TE Bic 
BR 

然而 ， 针 对 基于 页 的 SDSM 上 运行 调试 程序 时 还 会 出 现 另 一 个 困难 。 如 采 网 络 上 的 一 个 节点 
修改 了 共 衬 变量 的 值 ， 那 么 需要 该 变量 的 其 他 任何 节 氮 都 必须 通过 网 络 事务 获得 更 新 后 的 值 。 再 
次 说 明 ， 这 件 事 的 具体 发 生 方法 取决 于 SDSM 系 统 ， 但 是 这 意味 着 ， 单 步调 试 在 一 个 执行 点 执行 
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代码 时 , 可 能 发 现 GDB 神 秘 地 挂 起 ,因为 节点 正在 等 竺 另 一 个 布点 最 近 修 改过 的 变量 的 本 地 副本 。 
如 果 你 碰巧 还 在 运行 一 个 独立 的 GDB 会 话 ， 以 蛙 步 调试 男 一 个 节点 上 的 代码, 那么 下 到 第 二 个 市 
点 上 的 调试 会 话 有 了 中 够 的 进度 后 ， 第 一 个 节点 上 才 会 发 生 更 新。 换言之 ， 如 果 在 SDSM 应 用 程 
序 调试 期 间 程序 员 不 够 警觉 和 小 心 ， 那 么 他 可 能 由 于 调试 进程 本 喘 使 目 己 陷入 死 锁 。 

SDSM 和 情况 在 某 种 意义 上 类 似 于 消 恩 传递 的 情况 : 需要 类似 上 面 的 MPI 示 例 中 的 debugwait 
变量 。 该 变量 允许 程序 在 所 有 市 点 上 和 暂停, 给 了 程序 员 在 每 个 节点 上 附加 GDB 并 从 头 开始 单 步 调 
试 程 序 的 机 会 。 

5.4 扩展 示例 

本 节 介 绍 一 个 调试 用 OpenMP 开 发 的 共享 内 存 应 用 程序 的 示例 。 下 和 面 先 介绍 OpenMP 的 必 备 
知识 ， 只 要 对 线程 有 基本 了 解 即 可 。 
5.4.1 OpenMP 要 述 

OpenMP 本 质 上 是 线程 管理 操作 的 高 级 并 行 编程 接口 。 线 程 数 量 通 过 环境 变量 OMP_NUM_ 
THREADS 设 置 。 例 如 ， 在 C Shell 下 ， 在 shell 提 示 符 下 键入 : 

% setenv OMP NUM THREADS 4 
可 以 安排 4 个 线程 。 由 C 语 言 组 成 的 应 用 程序 代码 中 散布 者 OpenMP 指 令 。 每 个 指令 适用 于 该 指令 
后 面 的 块 ， 用 左右 花 括 号 定 界 。 最 基本 的 指令 为 : 

#pragma omp parallel 

这 个 指令 建立 了 oMP_NUM_THREADS 线 程 ， 每 个 线程 并 发 执行 pragma 后 面 的 代码 块 。 这 个 块 中 
Ws RUN BER s 

另 一 个 非常 音 见 的 OpenMP 指 令 是 : 









































#pragma omp barrier 

ta tae ARE ERAR”. FE Be EIA BK — AI SPE, ELBE Ae Be es T 
这 那里 。 

如 来 布 户 只 有 一 个 线程 执行 条 个 块 , 而 其 他 线程 素 过 这 个 块 , 可 以 通过 编号 如 下 代码 来 实现 。 








#pragma omp single 


这 样 的 块 后 面 立 即 有 一 个 隐 合 的 障碍 。 
虽然 有 很 多 其 他 OpenMP 指 令 ， 但 是 本 例 中 使 用 的 为 一 个 指令 是 : 





#pragma omp critical 


顾名思义 ， 该 指令 创建 了 一 个 关键 部 分 ， 其 中 在 任何 给 定时 间 只 允许 一 个 线程 。 
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5.4.2 OpenMP 示 例 程序 

我 们 实现 着 名 的 Dijkstra 算 法 来 确定 加 权 图 中 一 对 顶点 之 间 的 最 小 距离 。 给 出 相 邻 顶点 之 间 
的 距离 《如 果 两 个 顶点 不 相 令 ， 那 么 它们 之 间 的 距离 被 设置 为 无 穷 大 )。 目标 是 求 项 点 0 和 其 他 所 
有 顶点 之 间 的 最 小 距离 。 

人 下面 是 源 文 件 W7stra.c。 访 程序 产生 指定 数目 的 顶点 之 间 的 随机 边 长 ， 然 后 求 项 点 0 到 其 他 
各 顶点 之 间 的 最 小 距离 。 


1 // dijkstra.c 











3  // OpenMP example program: Dijkstra shortest-path finder in a 
4  // bidirectional graph; finds the shortest path from vertex 0 to all 
;  // others 


; // usage: dijkstra nv print 


9  // where nv is the size of the graph, and print is 1 if graph and min 
w // distances are to be printed out, 0 otherwise 


2 #include «omp.h» // required 
is finclude <values.h> 


is // including stdlib.h and stdio.h seems to cause a conflict with the 
i // Omni compiler, so declare directly 

5; extern void *malloc(); 

is extern int printf(char *,...); 


x»  // global variables, shared by all threads 


int nv // wnimhar af yvarticac 
He rnv, ff Timber UI VELLI 


29 «notdone, // vertices not checked yet 

25 nth, // number of threads 

94 chunk, // number of vertices handled by each thread 
25 md, // current min over all threads 

2 mv; // vertex which achieves that min 


1 
= 


TT 


xs int *ohd, // 1-hop distances between vertices; "ohd[i][j]" is 
29 i] ohd[ixnv+j | 
30 xmind; // min distances found so far 


s void init(int ac, char **av) 

5 — ( inti,j,tmp; 

T nv - atoi(av[1]); 

35 ohd = malloc(nv«nv«sizeof(int)); 
36 mind = malloc(nv*sizeof(int)); 

87 notdone = malloc(nv*sizeof(int)); 
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// random graph 


for (i = 0; i« nv; itt) 
for (j = i; j < nv; je) { 
if (j == i) ohd[ixnv+i] = 0; 
else { 
ohd[nv*itj] = rand() % 20; 
ohd[nv*jri] = ohd[nv*it+j]; 
} 
} 
i < nv; i++) 1 


// finds closest to 0 among notdone, among s through e; returns min 
// distance in xd, closest vertex in xv 
void findmymin(int s, int e, int *d, int xv) 
L ant xs 

xd = MAXINT; 

for (i = s; i <= e; i++) 

if (notdone[i] && mind[i] < *d) { 
*d = mind[i]; 


kV = 1; 


// for each i in {s,...,e}, ask whether a shorter path to i exists, through 
// mv 
void updatemind(int s, int e) 
( int i; 
for (i = s; i <= ej i++) 
if (notdone[i]) 
if (mind[mv] + ohd[mvxnv+i] < mind[i]) 
mind[i] = mind[mv] + ohd| mvxnv+i]; 


void dowork() 
{ 
#pragma omp parallel 
{ int startv,endv, // start, end vertices for this thread 
step, // whole procedure goes nv steps 
mymv, // vertex which attains that value 
me = omp get thread num(), 
mymd; // min value found by this thread 
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#pragma omp single 
{ nth = omp get num threads(); chunk = nv/nth; 
printf("there are %d threadsWn",nth); } 
startv - me * chunk; 
endv = startv + chunk - 1; 
// the algorithm goes through nv iterations 
for (step = 0; step < nv; step++) { 
// find closest vertex to 0 among notdone; each thread finds 
// closest in its group, then we find overall closest 
#pragma omp single 
{ md = MAXINT; 
mv = Q; 
} 
findmymin(startv,endv,&mymd, &mymv) ; 
// update overall min if mine is smaller 
#pragma omp critical 
{ if (mymd « md) 
{ md = mymd; } 


} 


#pragma omp barrier 

// mark new vertex as done 
#pragma omp single 

{ notdone[mv] = 0; } 

// now update my section of ohd 
updatemind(startv,endv); 


v 


int main(int argc, char **argv) 
{ int i,j,print; 
init (argc, argv); 
// start parallel 
dowork(); 
// back to single thread 
print = atoi(argv[2]); 
if (print) { 
printf("graph weights:\n"); 
for (i = 0; i < nv; i++) { 
for (j = 0; j < nv; j++) 
printf("%u  ",ohd[nv«iej]); 
printf("\n"); 
} 
printf("minimum distances:\n"); 
for (i = 1; i < nv; i++) 
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198 printf("%u\n",mind[i]); 
129 } 
1300 } 








LEBER PAREN CAERE., ARRORA MANR, ERAP E RER” 
集合 中 的 顶点 1~~5。 在 该 算法 的 每 次 迭代 中 ， 进 行 如 下 操作 。 

(1) 沿 者 到 目前 为 止 的 已 知 路 丛 求 得 离 顶 点 0 最 近 的 “未 完成 ”顶点 v。 这 种 检查 被 所 有 线程 
共享 ， 每 个 线程 检查 相等 数量 的 项 点。 完成 这 一 工作 的 函数 是 findmymin()。 

(2) 然后 将 v 移 到 “已 完成 ”集合 。 

(3) 对 于 “未 完成 ”集合 中 余下 的 所 有 顶点 i， 检 查 沿 厦 到 目前 为 止 的 已 知 路 径 先 从 0 到 v， 然 
后 一 下 子 从 v 跳 到 i， 是 否 比 从 0 人 i 的 当前 已 知 最 短 距离 更 短 。 如 果 是 这 样 ， 相 应 地 更 狐 该 距离 。 
执行 这 些 动作 的 函数 是 updatemind() 。 

该 迭代 继续 ， 直 到 “未 完成 ”集合 为 空 。 

由 于 OpenMP 指 令 需 要 预 处 理 ， 因 此 总 是 有 失去 原来 的 行 写 和 变量 及 函数 名 的 潜在 问题 。 为 
了 了 解 如 何 解 决 这 个 问题 ， 我 们 将 讨论 两 个 不 同 编 详 右 的 情况 。 我 们 首先 讨论 Omni 编 详 器 
CAttp://www.hpcc.jp/Omni/) ， 然 后 讨论 GCC (需要 4.2 或 更 狐 的 版 本 )。 

在 Omni 下 对 代码 展开 编 详 : 






































$ omcc -g -o dij dijkstra.c 





当 编 详 该 程序 并 用 4 个 线程 运行 它 以 后 ， 我 们 发 现 它 没有 正确 地 工作 。 


$ dij 61 

there are 4 threads 
graph weights: 

0 3 6 17 15 13 
3 0 15 6 12 9 
6 15 012 7 
17 6 1 0 10 19 
15 12 2 10 0 3 
13 9 7 19 3 0 
minimum distances: 
3 

6 

17 

15 

13 


手工 分 析 这 个 图 可 以 友 现 ， 正 确 的 最 小 距离 应 为 3、6、7、8 和 11。 

然后 ， 我 们 在 GDB 中 运行 程序 。 理 解 OpenMP 通 过 指令 工作 这 一 事实 的 后 果 十 分 重要 。 虽 然 
这 里 讨论 的 两 个 编 详 需 基 本 都 你 留 了 行 号 、 函 数 名 等 ， 但 是 两 者 之 间 仍 然 有 一 坚 关 开 。 当 试图 在 
可 执行 文件 dij 中 设置 断 点 时 ， 看 看 在 我 们 的 GDB 会 话 开端 发 生 了 什么 。 
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(gdb) tb main 

Breakpoint 1 at Ox80492af 

(gdb) r 61 

Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1208490304 (LWP 11580) | 
[Switching to Thread -1208490304 (LWP 11580) | 
Ox080492af in main () 

(gdb) 1 


1 /tmp/omni C 11486.c: No such file or directory. 
in /tmp/omni C 11486.c 





我 们 发 现 断 点 不 在 源 文 件 中 , 而 是 在 Omni 的 OpenMP 基 础 设施 代码 中 。 换言之 , 这 里 的 main() 
是 Omni 的 main()， 而 不 是 程序 员 自 己 的 main()。Omni 编 译 器 将 我 们 的 main() 名 称 变 成 了 
_ompc_main(). 


Jy f fEmain() hve, BEA: 








(gdb) tb ompc main 
Breakpoint 2 at 0x80491b3: file dijkstra.c, line 114. 


然后 通过 continuing 来 检查 它 : 


(gdb) c 
Continuing. 
[New Thread -1208493152 (LWP 11614)] 


[Naw Thveoad .2254909230n9 ID 4454651 
| 9 TL CIUI oO UO LLLI lI21vVloJ J 


[New Thread -1229472864 (LWP 11616) ] 
 ompc main (argc-3, argv-Oxbfab6314) at dijkstra.c:114 
114 init(argc,argv); 


这 段 代 码 中 有 熟悉 的 init() 人 代码。 当然 ， 可 以 执行 命令 
(gdb) b dijkstra.c:114 


注意 3 个 新 线程 的 创建 ， 总 共 是 4 个 线程 。 

然而 ， 我 们 选择 了 设置 断 点 ， 在 这 里 我 们 必须 比 一 般 情 况 多 做 一 点 工作 ， 因 此 在 程序 的 两 次 
运行 期 间 停 留 在 一 个 GDB 会 话 中 特别 重要 ， 甚 至 当 我 们 修改 了 源 代 码 并 重新 编译 时 也 不 要 退出 
GDB 会 话 ， 以 便 保 留 断 点 、 条 件 等 。 如 果 在 这 期 间 关 财 了 GDB 会 话 ， 束 不 得 不 费时 费力 地 重新 
设置 这 些 内 容 。 

现在 ， 如 何 跟 踩 程序 错误 ? 在 每 次 迭代 结束 时 检查 结果 ， 是 调试 这 个 程序 的 一 种 卓然 方式 。 

要 结果 在 “未 完成 ”集合 中 《〈 即 在 数组 notdone[] 中 ) ， 以 及 在 从 0 到 其 他 顶点 之 间 的 已 知 距离 
的 当前 列表 中 〔 即 在 数组 mind[] 中 〉。 例 如 ， 在 第 一 次 达 代 以 后 ，“ 示 完成 ”集合 应 该 由 顶点 2、 
3、4 和 5 组 成 ， 在 该 从 代 中 选择 了 顶点 1。 
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有 了 这 些 信息 后 ， 让 我 们 应 用 一 下 确认 原则 ， 并 在 dowork() 中 for 循 环 的 每 次 欠 代 后 检查 
notdone[ ] 和 mind[]。 

必须 评 慎 地 确定 设置 断 点 的 确切 位 置 。 虽 然 第 108 行 算法 的 主 循环 的 末尾 像 是 一 个 很 目 然 的 
位 置 ， 但 是 实际 上 可 能 这 并 不 是 最 佳 位 置 ， 因 为 GDB 针 对 每 个 线程 都 在 那里 停止 。 我 们 应 选择 在 
OpenMP 的 一 个 single 块 内 放置 断 点 ， 这 样 可 以 只 对 于 一 个 线程 停止 。 

因此 ， 我 们 是 从 第 二 次 欠 代 起 在 循环 的 开始 位 置 来 检 答 上 一 次 迭代 的 结 琳 。 

(gdb) b 92 if step »- 1 


Breakpoint 3 at 0x80490e3: file dijkstra.c, line 92. 


(gdb) c 
Continuing. 
there are 4 threads 














Breakpoint 3, — ompc func 0 () at dijkstra.c:93 


93 { md = MAXINT; 

让 我 们 确认 第 一 次 迭代 确实 选择 了 要 移出 “未 完成 ”集合 的 正确 顶点 〈 顶 点 1) 。 
(gdb) p mv 

$1 = 0 


然而 ， 这 个 假设 还 没有 得 到 确认 。 查 看 这 段 代码 可 以 发 现 ， 我 们 在 第 100 行 上 忘记 了 设置 mv。 
我 们 将 它 修改 为 ; 


i md = mymd; mv = mymv; } 


因此 ， 我 们 再 次 重新 编译 和 运行 该 程序 。 正 如 本 节 【〈 以 及 本 书 的 其 他 地 方 ) 前 面 提 到 的 ， 运 
行程 序 时 不 退出 GDB 非 常 有 帮助 。 虽然 可 以 在 男 一 个 终端 窗口 中 运行 该 程序 , 但 是 为 了 有 点 儿 变 
化 ， 让 我 们 在 这 里 采用 另 一 种 不 同 的 方法 。 我 们 通过 执行 dis 命 令 来 暂时 禁用 断 点 ， 然 后 从 GDB 
中 重新 编译 程序 ， 再 使 用 ena 重 新 局 用 呵 点 。 


(gdb) dis 

(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 

"/debug/dij' has changed; re-reading symbols. 
Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 

[New Thread -1209026880 (LWP 11712)] 
[ 
[ 











New Thread -1209029728 (LWP 11740)] 
New Thread -1219519584 (LWP 11741)] 
[New Thread -1230009440 (LWP 11742)] 
there are 4 threads 

graph weights: 
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0 3 6 17 15 13 
3 0 15 6 12 9 
6 15 0 12 7 
17 6 1 0 10 19 
15 12 2 10 0 3 
13 9 7 19 3 0 
minimum distances: 


Program exited with code 06. 








(gdb) ena 
ENVIAR AR. TERM RAAT AAD AZ 
(gdb) r 


Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1209014592 (LWP 11744) ] 

[New Thread -1209017440 (LWP 11772) ] 

[New Thread -1219507296 (LWP 11773) ] 

[New Thread -1229997152 (LWP 11774) ] 

there are 4 threads 

[Switching to Thread -1209014592 (LWP 11744) ] 


Breakpoint 3, — ompc func 0 () at dijkstra.c:93 
93 ( md - MAXINT; 


(gdb) p mv 
$2 - 


mv 现在 至 少 有 正确 的 值 。 再 检查 mind[ ] 。 


(gdb) p *mind@6 
$3 8-10, 3; 0, 17, 35, 13] 











主题 ， 因 为 通过 malloc() 动 态 地 构造 了 mind[] 数 组 ， 因 此 不 能 使 用 GDB 的 print 命 令 的 一 般 
"n. 我 们 使 用 了 GDB 的 人 工 数组 功能 。 
无 论 如 何 ，mind[] 都 是 错误 的 。 例 如 ，mind[3] 应 当 是 3+6=9， 然 而 它 是 17。 让 我 们 检查 更 新 
mind[ 的 代码 。 


(gdb) b 107 if me == 1 
Breakpoint 4 at Ox8049176: file dijkstra.c, line 107. 
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(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 
Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1209039168 (LWP 11779)] 

[New Thread -1209042016 (LWP 11807)] 

[New Thread -1219531872 (LWP 11808)] 

[New Thread -1230021728 (LWP 11809)] 

there are 4 threads 

[Switching to Thread -1230021728 (LWP 11809) | 


Breakpoint 4, — ompc func O () at dijkstra.c:107 
107 updatemind(startv,endv); 


首先 ， 确 认 startv 和 endv 上 只 有 有 意义 的 值 。 


(gdb) p startv 





$4 = 1 
(gdb) p endv 
$5 = 1 


这 个 块 的 大 小 仅 为 1 吗 ? 让 我 们 看 一 下 。 

(gdb) p chunk 

$6 = 1 

当 检 查 了 chunk 的 计算 结 东 后 ， 我 们 意识 到 需要 等 分 nv 的 线程 数量 。 后 者 的 值 为 6， 它 不 能 被 
我 们 的 线程 数 4 整除 。 我 们 先 记 下 以 后 要 插入 一 些 错误 捕获 代码 ， 然 后 暂时 将 线程 数 减 少 为 3。 

同样 ， 做 这 件 事 时 不 要 退出 GDB。 虽 然 GDB 继 承 了 首次 调用 时 的 环境 变量 ， 但 是 也 可 以 在 
GDB 中 修改 或 设置 这 些 变量 的 值 ， 我 们 在 这 里 所 做 的 事 用 如 下 代码 表示 。 


(gdb) set environment OMP NUM THREADS = 3 


























现在 再 次 运行 程序 。 


(gdb) dis 

(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 

Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 

[New Thread -1208707392 (LWP 11819)] 

[New Thread -1208710240 (LWP 11847)] 
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[New Thread -1219200096 (LWP 11848)] 
there are 3 threads 

graph weights: 

0 3 6 17 15 13 

3 0 15 6 12 9 

6 15 0 1 2 7 

17 6 1 0 10 19 

15 17 2 10 0 3 

13 9 7 19 3 0 

minimum distances: 


Program exited with code 06. 





(gdb) ena 
唉 ， 得 到 的 仍然 是 错误 的 答案 ! 继续 检查 mind[ ] 的 更 新 进程 。 
(gdb) r 


Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1208113472 (LWP 11851)] 

[New Thread -1208116320 (LWP 11879)] 

[New Thread -1218606176 (LWP 11880)] 

there are 3 threads 

[Switching to Thread -1218606176 (LWP 11880)] 


Breakpoint 4, — ompc func O () at dijkstra.c:107 
107 updatemind(startv,endv); 

(gdb) p startv 

y 52 

(gdb) p endv 

$8 - 3 


好 了 ， 在 me=1 的 情况 下 ， 得 到 了 startv 和 endv 的 正确 值 。 因 此 ， 进 入 函数 : 


(gdb) s 
[Switching to Thread -1208113472 (LWP 11851)] 


Breakpoint 3, — ompc func 0 () at dijkstra.c:93 
93 ( md = MAXINT; 
(gdb) c 
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Continuing. 

[Switching to Thread -1218606176 (LWP 11880)] 
updatemind (s-2, e-3) at dijkstra.c:69 

69 for (i = s; i <= e; i++) 


注意 ,由 于 上 下 文 在 这 些 线程 之 间 切 换 ,， 因 此 我 们 没有 立即 进入 updatemind() 。 现 在 检查 1i=3 





(gdb) tb 71 if i -- 3 
Breakpoint 5 at 0x8048fb2: file dijkstra.c, line 71. 


(gdb) c 

Continuing. 

updatemind (s-2, e-3) at dijkstra.c:71 

74 if (mind[mv] + ohd[mv*nv+i] < mind[i]) 


Be. RIS Jet t] 


(gdb) p mv 
$9 - O 
4 —^ AIRES. HMPA, FEA IEE, mv. MT AXE A SIN E OVE ? 


n a MU E EN 
的 线程 已 经 在 第 93 行 上 ; 换言之 ， 它 已 经 在 该 算法 主 循环 的 下 一 次 迭代 中 。 事 实 上 ， 当 我 们 按 下 
c 来 继续 时 ， 它 甚至 执行 了 第 94 行 ， 即 





该 线程 重 写 了 mv 以 前 的 值 1， 因 此 更 新 mind[3] 的 线程 现在 依赖 于 mv 的 钳 误 值 。 解 决 方法 是 添 
加 另 一 个 屏障 (barrier) 。 


updatemind(startv, endv) ; 
#pragma omp barrier 








修复 这 个 问题 后 ， 程 序 就 可 以 正确 地 运行 。 

前 述 代 人 码 是 用 Omni 编 译 器 的 。 正 如 我 们 所 提 到 的 ， 从 版 本 4.2 起 ，GCC 也 能 处 理 OpenMP 代 
仔 了 。 只 要 在 GCC 命令 行 上 添加 -fopenmp 标 记 即 可 。 

与 Omni 不 同 的 是 ，GCC 生 成 代码 时 ， 从 一 开始 ，GDB 的 焦点 束 在 你 目 己 的 源 代码 中 。 因 此 ， 
在 GDB 会 话 的 开端 执行 如 下 命令 。 


(gdb) b main 











实际 上 会 叶 仑 在 日 已 的 main() 中 设置 一 个 断 点 ， 这 与 我 们 在 Omni 编 译 占 中 看 到 的 情况 不 同 。 
然而 ， 在 编写 本 书 时 ，GCC 的 一 个 主要 缺点 是 : OpenMP parallel 块 内 的 局 部 变量 (OpenMP 
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术语 称 之 为 私有 变量 ) 的 符号 在 GDB 中 不 可 见 。 例 如 ， 对 上 面 Omni 生 成 的 代码 执行 如 下 命令 对 
GCC 生成 的 代码 也 适用 : 

(gdb) p mv 
但 是 命令 

(gdb) p startv 


则 不 适合 于 GCC 生成 的 代码 。 
当然 ， 这 个 问题 有 人 解决 的 办 法 。 例 如 ， 要 知道 startv 的 值 ， 可 以 查询 updatemind() 中 s 的 值 。 
但 愿 这 个 问题 在 GCC 的 下 一 个 版 本 中 会 得 到 解决 。 











FF OK IE ER 








1r 调试 过 程 中 会 产生 各 种 调试 工具 没 法 处 理 的 问题 ， 本 章 将 讨论 其 中 的 部 分 问题 。 


6.1 根本 无 法 编译 或 加 载 
尽管 GDB、DDD 和 Eclipse 的 威力 不 小 ， 但 是 如 果 程 序 根 本 不 能 编译 ， 调 试 工具 再 强大 也 无 
可 奈何 。 本 节 介 绍 处 理 这 种 情况 的 一 些 技巧 。 
6.1.1 语法 错误 消息 中 的 “幽灵 ” 行 号 
有 时 编 详 器 指出 第 x 行 有 话 法 错误 ， 而 事实 上 第 x 行 完全 正确 ， 真 正 的 错误 在 表面 某 一 行 上 。 
人 例如， 下面 是 第 3 章 的 源 文件 Diztree.x， 在 还 没有 指出 的 某 个 地 方 抛 出 了 一 个 语法 错误 〈 其 实 
如 果 要 查找 这 个 错误 ， 是 相当 明显 的 )。 


1 // bintree.c: routines to do insert and sorted print of a binary tree 











s #include <stdio.h> 
4  #include <stdlib.h> 


6 struct node { 





7 int val; // stored value 

8 struct node «left;  // ptr to smaller child 
9 struct node «right; // ptr to larger child 
10 rf 


ıı typedef struct node nsp; 
i4 nsp root; 
is nsp makenode(int x) 


T 


18 nsp tmp; 
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20 tmp = (nsp) malloc(sizeof(struct node)); 
91 tmp-»val - x; 
29 tmp-»left = tmp-»right = 0; 
23 return tmp; 
"S 
x void insert(nsp *btp, int x) 
27 f 
98 nsp tmp = *btp; 
: if (*btp == 0) { 
$1 xbtp - makenode(x); 
39 return; 
33 } 
34 
35 while (1) 
36 1 
37 if (x « tmp-»val) { 
38 
90 if (tmp-»left !- 0) ( 
40 tmp = tmp-»left; 
+l } else { 
(2 tmp-»left - makenode(x); 
48 break; 
tl } 
AS 
} else { 
A? 
48 if (tmp-»right != 0) { 
19 tmp = tmp->right; 
50 } else { 
51 tmp->right = makenode(x); 
52 break; 
;3 } 
54 
5 } 
6] 
s Void printtree(nsp bt) 
» 1 
60 if (bt -- 0) return; 
T printtree(bt-»left); 
62 printf ("%d\n" ,bt-»val); 
63 printtree(bt-»right); 
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os int main(int argc, char xargv[]) 


o (1 

68 int 1; 

o9 

70 root - 0; 

"i for (i = 1; i < argc; i++) 

T insert(&root, atoi(argv[i])); 
73 printtree(root); 

7 )] 


通过 GCC 运行 这 段 代 码 产生 的 结果 为 : 
$ gcc -g bintree.c 


bintree.c: In function "insert': 
bintree.c:75: parse error at end of input 


由 于 第 74 行 是 源 文件 的 末尾 ,因此 第 二 条 错误 消息 至 少 可 以 说 提供 的 信息 量 相当 少 。 但 是 人 第 
一 条 消息 表明 问题 在 insert() 中 ， 因 此 这 是 一 个 线索 ， 尽 管 这 条 消息 没有 指出 问题 是 什么 ， 也 没 
有 指出 问题 在 何 处 。 
在 这 种 情况 下 ， 和 典型 的 出 钳 诛 因 是 少 了 闭合 花 插 号 或 分 号 。 可 以 直接 检 否 有 没有 缺少 这 样 的 
， 但 是 在 大 文件 中 这 样 做 比较 困难 。 下 面 我 们 采用 另 一 种 方法 。 

第 1 章 介绍 过 确认 原则 。 这 里 ， 先 确认 问题 确实 在 insert() 中 。 要 进行 这 样 的 确认 ， 和 暂时 先 
将 该 函数 从 源 代码 中 注释 挥 。 





























tmp-»val = x; 
tmp->left = tmp-»right = 0; 
return tmp; 


} 


// void insert(nsp *btp, int x) 





// 1 

// nsp tmp - xbtp; 

// 

/7 if (*btp == 0) 1 

// *btp = makenode(x); 
// return; 

// } 

// 

// while (1) 

// { 

// if (x < tmp->val) { 
// 

// if (tmp-»left !- 0) { 


// tmp - tmp-»left; 
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// } else 1 

// tmp-»left = makenode(x); 
// break; 

// } 

// 

// } else { 

// 

jj if (tmp->right != 0) { 

// tmp - tmp-»right; 

"Pi } else 1 

// tmp-»right - makenode(x); 
// break; 

// } 

// 

// } 

// } 


void printtree(nsp bt) 
{ 
if (bt == 0) return; 


说 明 ”最 好 使 用 快捷 方式 来 注释 掉 该 水 数 ， 比 如 采用 块 操作 。 第 7 章 将 介绍 适用 于 调试 环境 的 文本 编 
辑 器 快捷 方式 。 


保存 文件 ， 然 后 重新 运行 GCC。 


$ gcc -g bintree.c 

/tmp/ccgOLDCS.o: In function ~main': 

/home/matloff/public html/matloff/public html/Debug/Book/DDD/bintree.c:72: 
undefined reference to 'insert' 

collect2: ld returned 1 exit status 


不 要 被 连接 器 LD 关于 找 不 到 insert() 的 抱 候 分 获 注 意 力 。 毕 苋 早 束 知 道 肯 定 会 有 这 样 的 抱 
候 ， 因 为 前 面 已 经 注释 挤 了 该 函数 。 重 要 的 是 已 经 没有 像 以 前 那样 抱 仿 语法 错误 。 因 此 ,确认 了 
语法 错误 在 insert() 中 。 现 在 ， 取 消 该 函数 的 注释 (同样 ， 最 好 使 用 文本 编辑 右 快 捷 方 式 ， 比 如 
“撤销 ”) 并 保存 文件 。 另 外 ， 为 了 确保 已 正确 地 恢复 ， 重 新 运行 GCC 以 确认 这 一 语法 错误 再 次 出 
现 〈 这 里 不 再 显示 该 错误 )。 

这 时 可 以 应 用 第 1 章 介 绍 的 另 一 个 原则 : 二 分 搜索 原则 。 反 复 缩 小 图 数 insert() 中 的 搜索 区 
域 ， 每 次 将 搜索 区 域 切 成 两 半 ， 直 到 获得 足够 小 的 区 域 找 出 语法 错误 。 

为 了 达到 这 个 目的 ， 先 将 该 函数 的 大 约 一 半 内 容 注 释 挥 。 做 这 件 事 的 一 种 合理 方式 是 直接 
将 while 循 环 注释 了 ， 然 后 重新 运行 GCC。 





























6.1 根本 无 法 编译 或 加 载 “159 
$ gcc -g bintree.c 
$ 


这 时 发 现 错误 消息 消失 了 ， 因 此 语法 问题 肯定 在 这 个 循环 中 的 茶 个 地 方 。 那 么 ， 已 将 问题 的 范 
围 崎 小 到 了 该 函数 的 一 半 ， 现 在 继续 将 这 一 区 域 切 成 两 半 。 为 此 ， 将 else 人 代码 也 注 杰 邱 。 

















void insert(nsp xbtp, int x) 





1 
nsp tmp = +*btp; 
if (*btp == 0) { 
*btp = makenode(x); 
return; 
Jj 
while (1) 
i 
if (x « tmp-»val) { 
if (tmp-»left != 0) { 
tmp = tmp-»left; 
} else { 
tmp->left = makenode(x) ; 
break; 
} 
} // else { 
// 
// if (tmp->right != 0) { 
id tmp = tmp->right; 
jj } else { 
// tmp->right = makenode(x); 
// break; 
// } 
// 
// } 
j 








重新 运行 GCC， 发 现 问题 再 次 出 现 : 


$ gcc -g bintree.c 
bintree.c: In function "insert': 
bintree.c:75: parse error at end of input 


因此 ， 语 法 错误 要 么 在 if 块 中 ， 要 么 在 函数 末尾 。 这 时 ， 已 经 将 问题 范围 络 小 到 了 只 有 7 行 
的 代码 内 ， 因 此 下 接 通 过 观察 应 该 束 可 以 伍 出 问题 ， 原 因 在 于 不 小 心 着 挥 了 外 部 if-then-else 
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二 分 搜索 原则 对 于 查找 未 知 位 置 的 语法 错误 非常 有 帮助 。 但 是 在 暂时 注释 掉 代 码 的 过 程 中 ， 
一 定 不 要 造成 狐 的 语法 错误 ! 要 像 我 们 这 样 ， 将 整个 函数 、 整 个 循环 一 起 注释 掉 。 
6.1.2 ”缺少 库 


有 时 GCC〔 实 际 上 是 构建 程序 的 过 程 中 GCC 调 用 的 连接 右 LD) 会 通知 你 无 法 找到 代码 调用 
的 一 个 或 多 个 函数 。 这 通常 是 由 于 没有 成 功 地 将 库 函 数 的 位 置 通知 GCC。 本 书 的 很 多 读者 肯定 都 
精通 这 一 主题 ， 但 是 为 了 照顾 不 精通 这 一 主题 的 读者 ， 我 们 在 本 节 进 行 一 下 简单 的 介绍 。 注 意 ， 
本 市 的 讨论 主要 适用 于 Linux， 它 也 基本 适用 于 其 他 Unix 类 型 的 操作 系统 。 

1. 示例 

让 我 们 使 用 下 面 的 简单 代码 作为 示例 ， 它 包含 a.c 中 的 一 个 主 程序 : 

// a.C 






































int f(int x); 


main() 

{ 
int v; 
scanf ("%d" ,&v); 
printf("%d\n", f(v)); 





} 
以 及 z/b.c 中 的 一 个 子 程序 : 
/7 b.c 


int f(int x) 





{ 
return xxx; 
} 
如 条 试图 在 没有 连接 到 &c 中 的 代码 时 就 编译 wc， 那 么 LD 当 然 会 抱怨 。 
$ gcc -g a.c 


/tmp/ccIP5WHu.o: In function ~main': 
/debug/a.c:9: undefined reference to `f' 
collect2: ld returned 1 exit status 


我 们 可 以 进入 z 中 ， 编 译 b.c， 然 后 连接 目标 文件 。 
$ cdz 
$ gcc -g -c b.c 


$d 
$ gcc -g a.c z/b.o 
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然而 ， 如 果 有 很 多 函数 要 连接 ， 这 些 函 数 可 能 来 目 人 不 同 的 源 文 件 ， 而 且 这 些 函 数 对 于 将 来 要 
编写 的 程序 可 能 有 用 ， 那 么 可 以 创建 一 个 库 《〈 这 是 一 个 存档 文件 )。 库 文件 分 为 两 种 。 当 编 详 调 
Fi BAS PE P PR RC EE ST, 那 坚 函数 变 成 最 终 可 执行 文件 的 一 部 分 。 为 一 方面 , 如 末 库 是 动态 的 ， 
那么 上 只 有 实际 执行 了 程序 ， 这 些 函 数 才 会 真正 附加 到 调用 代码 上 。 

下 面 介绍 如 何 为 本 节 的 示例 创建 毅 态 库 ， 假 设 名 为 /288.a。 


$ gcc -g -c b.c 
$ ar rc lib88.a b.o 


这 里 的 ar 命 令 从 它 在 文件 b.o 找 到 的 函数 中 创建 了 库 1i588.4a。 然 后 编 详 主 程序 : 














$ gcc -g a.c -188 -Lz 


这 里 的 -1 选项 是 一 种 快捷 方式 ， 与 如 下 代码 的 效果 相同 : 





$ gcc -g a.c lib88.a -Lz 


这 个 选项 指示 GCC 告 诉 LD， 它 将 需要 在 库 1i588.a (或 者 下 面 将 要 介绍 的 动态 变 体 ) 中 查找 函数 。 





说 明 在 Unix 系 统 上 ， 按 惯例 是 在 静态 库 文件 名 后 面 加 上 后 级 .aq，a 代 表 archive。 田 外 ， 任 何 库 的 
名 称 一 般 都 以 Lib 开 头 。 


-1 选项 指示 GCC 告诉 LD 在 查找 函数 时 顺便 在 其 他 目录 中 也 查找 一 下 《 除 当前 目录 和 默认 搜 
索 目录 以 外 )。 在 本 节 的 示例 中 ，z 就 是 这 样 的 目录 。 

这 种 方法 的 缺点 是 ， 如 果 有 很 多 程序 在 使 用 同一 个 库 ， 那 么 每 个 程序 都 会 在 磁盘 上 包含 访 
库 的 独立 副本 ， 这 样 比较 浪费 空间 。 使 用 动态 库 可 以 解决 这 个 问题 (代价 是 需要 一 点 额外 的 加 
载 时 间 )。 

在 这 里 的 示例 中 ， 使 用 GCC 直接 创建 动态 库 ， 而 不 是 使 用 wr。 在 z 中 将 运行 : 


$ gcc -fPIC -c b.c 
$ gcc -shared -o lib88.so b.o 


这 上 段 代 人 码 创 建 了 动态 库 1i588.s0。(Unix 中 命名 动态 库 的 惯例 是 使 用 后 级 .so， 表 示 shared 
object， 后 面 可 能 会 跟着 版 本 号 。) 与 连接 静态 库 一 样 地 连接 到 这 个 动态 库 : 


$ gcc -g a.c -188 -Lz 

















然而 ， 它 现在 的 工作 方式 有 所 人 不同。 在 静态 库 的 情况 下 ， 从 库 中 调用 的 函数 会 成 为 可 执行 文 





件 coxvt 的 一 部 分 ， 现 在 wowt 仅 包含 一 个 表示 程序 使 用 了 库 11088.so 的 符号 。 重 要 的 是 ， 这 种 符号 
其 全 没有 表明 该 库 位 于 何 处 。GCC《 同 样 ， 实 际 上 是 LD) 要 在 编译 时 碍 看 /12288.so 的 唯一 原因 是 
为 了 得 到 连接 所 需 知道 的 该 库 的 信息 。 

连接 本 身 会 在 运行 时 发 生 。 操 作 系 统 会 搜索 1ib88.so， 然 后 将 它 连 接 到 程序 中 。 这 就 带 来 了 
操作 系统 在 何 处 执行 这 种 搜索 的 问题 。 
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首先 ， 使 用 1dd 命 令 检 查 程 序 需 要 哪些 库 ， 如 打 有 ， 操 作 系 统 可 以 在 何 处 找到 和 它们。 


$ ldd a.out 
lib88.so -» not found 
libc.so.6 => /lib/tls/libc.so.6 (0x006cd000) 
/lib/ld-linux.so.2 (0x006b0000) 


该 程序 需要 C 库 ， 并 在 目录 MipMis 中 找到 了 它 ， 但 是 操作 系统 没有 找到 1288.so。 后 者 在 目录 
/Debug/z 中 ， 但 是 该 目录 不是 操作 系统 的 正和 党 搜索 路 任 有 的 一 部 分 。 
解决 这 种 问题 的 一 种 方式 是 癌 该 搜索 路 径 中 添加 /Deprxeyz: 


为 setenv LD LIBRARY PATH ${LD_ LIBRARY PATH}:/Debug/z 


如 果 要 添加 几 个 目录 ， 将 目录 名 连同 冒号 的 字符 串 作 为 分 隔 符 。( 这 适用 于 C shell a£ TC 
shell.) 对 于 bash， 执 行 如 下 命令 : 


$ LD LIBRARY PATH=$LD LIBRARY PATH:/Debug/z 
$ export LD LIBRARY PATH 


让 我 们 确保 它 能 成 功 运 行 : 
$ ldd a.out 
lib88.so => /Debug/z/lib88.so (Oxf6ffe000) 


libc.so.6 => /lib/tls/libc.so.6 (0x006cd000) 
/lib/ld-linux.so.2 (0x006b0000) 


虽然 还 有 其 他 多 种 方法 ， 但 是 那些 方法 不 在 本 书 介绍 范围 之 列 。 

2. 开源 软件 中 库 的 用 法 

开源 软件 现在 很 流行 ， 尤 其 是 在 Linux 用 户 之 间 。 然 而 有 时 会 出 现 一 个 问题 ， 即 与 源 代 但 配 
套 有 的 构建 脚本 (通常 起 名 为 confieure〉 找 不 到 某 些 必需 的 库 。 试 图 通过 设置 LD_LIBRARY_PATH 环 
卉 变量 解决 该 问题 可 能 会 失败 。 由 于 这 个 问题 处 于 这 里 讨论 的 “缺少 库 ” 主 题 下 ， 而 且 源 代码 包 
中 通常 没有 记载 ， 因 此 这 里 有 必要 做 一 下 简单 的 解释 。 

这 种 问题 的 根源 季 第 在 于 cozjfigwre 调 用 的 名 为 pkecozjig 的 程序 。 这 个 程序 会 从 某 些 元 数据 文 
件 处 检索 关于 库 的 信息 。 这 样 的 文件 后 绥 为 .pc， 前 绥 是 库 的 名 称 。 人 例如， 文件 jipgcj.pc 中 包含 库 
文件 libgcj.so* 的 位 置 。 

pkconfige 搜 索 .pc 文 件 的 默认 目录 取决 于 pkeconfig 本 身 的 位 置 。 例如 ， 如果 程序 位 于 /sr/bin 中 ， 
则 搜索 /usrNAibp。 如 果 所 和 需 的 库 是 /usr/locaWUibp， 仪 在 这 个 目录 中 搜索 整 不够。 为 了 解决 这 个 问题 ， 
应 设置 环境 变量 为 PKG_CONFIG PATH。 在 C 或 TC shell 中 ， 执 行 如 下 shell 命 令 : 









































% setenv PKG CONFIG PATH /usr/lib/pkgconfig:/usr/local/lib/pkgconfig 


6.2 ”调试 GUI 程序 
如 今 ， 用 户 习 惯 于 应 用 程序 带 有 GUI (图 形 用 户 界 面 )。 当 然 ，GUI 也 是 程序 ， 因 此 可 以 应 用 
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一 般 调试 原理 ， 但 是 会 有 一 些 特殊 考虑 事项 。 

GUI 编 程 主要 是 调用 某 个 库 以 便 在 屏 笑 上 执行 各 种 操作 。 市 面 上 有 很 多 很 多 这 样 的 库 ， 用 途 
HWA Z. PARIDA Am. BEDE ETARE, REREH. 

因此 , RANE Sate HAAN, curses. ix^ EARR AC RT BETR AS CH EE 24 GUI 
(有 个 学 生 称 之 为 “基于 文本 的 GUI”)， 但 是 它 能 说 明 问 题 。 
调试 curses 程 友 


程序 员 可 以 使 用 curses 库 编写 让 光标 在 屏 秦 上 移动 的 代码 ， 改 变 字 符 的 闫 色 ， 或 者 改 成 反 白 
显示 ， 插 入 及 删除 文本 ， 等 等 。 

例如 ， 像 Vim 和 Emacs 这 样 的 文本 编辑 右 束 是 用 curses 编 写 的 。 在 Vim 中 ， 按 下 j 键 使 光标 癌 下 
移 一 行 。 键 入 dd 导致 删除 当前 行 ， 这 一 行 下 面 的 代码 行 同 上 移 一 行 ， 上 面 的 代码 行 仍 然 不 变 。 这 
些 动 作 通 过 调用 curses 库 中 的 函数 实现 。 

为 了 使 用 curses， 必 须 在 源 代 码 中 包括 如 下 语句 : 




















#include <curses.h> 
还 必须 连接 到 curses 库 : 

gcc -g sourcefile.c -lcurses 

以 下 和 面 这 段 代 人 码 为 例 。 访 代 人 码 运 行 Unix 的 命令 ps ax 来 列 出 所 有 进程 。 在 任何 给 定时 间 ， 都 
必须 突出 显示 光标 当前 所 在 的 行 。 按 下 u 和 d 键 可 以 将 光标 同上 或 同 下 移动 ， 等 等 。 参 见 代 人 码 中 的 
注释 但 看 完整 的 命令 列表 。 

如 果 以 前 没有 使 用 过 curses， 不 要 担心 ， 因 为 注释 中 说 明了 这 个 库 是 做 什么 的 。 


// psax.c; illustration of curses library 














// read this code in a "top-down" manner: first these comments and the global 
// vavriahles. then mainf). then the functions called hv mainí? 
£r V CAL LCL LL VS D 3 LINII ICALI Fg CIN-II Li Mb UL -LET 了 © LL -LS 中 vy WIA LUT y 


// runs the shell command ‘ps ax and saves the last lines of its output, 
// as many as the window will fit; allows the user to move up and down 


// within the window, with the option to kill whichever process is 
// currently highlighted 


ff wena PT AME 
ff u»dgc:. praA 


// user commands: 
// ‘u': move highlight up a line 


// 'd': move highlight down a line 
// 'k': kill process in currently highlighted line 
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// 'r': re-run ps ax for update 
// 'q': quit 


// possible extensions: allowing scrolling, so that the user could go 
// through all the 'ps ax' output, not just the last lines; allow 

// wraparound for long lines; ask user to confirm before killing a 

// process 


Hdefine MAXROW 1000 
Hdefine MAXCOL 500 


#include «curses.h» // required 
WINDOW *scrn; // will point to curses window object 


char cmdoutlines[MAXROW][MAXCOL]; // output of ‘ps ax' (better to use 
// malloc()) 
int ncmdlines,  // number of rows in cmdoutlines 
nwinlines, // number of rows our "ps ax" output occupies in the 


// xterm (or equiv.) window 


nt vr nmnacitin 


FTT Ji rirra mn 3 er 
MUM d if Ww LAL Llib LW pMOLLLVII LIT 2X. 


cmdstartrow, // index of first row in cmdoutlines to be displayed 
cmdlastrow; // index of last row in cmdoutlines to be displayed 


F 


// rewrites the line at winrow in bold font 
highlight() 
{ 
int clinenum; 
attron(A BOLD); // this curses library call says that whatever we 
// write from now on (until we say otherwise) 
// will be in bold font 
// we'll need to rewrite the cmdoutlines line currently displayed 
// at line winrow in the screen, so as to get the bold font 
clinenum = cmdstartrow + winrow; 
mvaddstr(winrow, 0, cmdoutlines[clinenum]); 
attroff(A BOLD); // OK, leave bold mode 
refresh(); // make the change appear on the screen 


// runs "ps ax" and stores the output in cmdoutlines 
runpsax() 
{ 
FILE *p; char In[MAXCOL]; int row, tmp; 
p = popen("ps ax","r"); // open UNIX pipe (enables one program to read 
// output of another as if it were a file) 
for (row = 0; row < MAXROW; row++) { 


6.2 ix GUI 42 165 


tmp = fgets(1n,MAXCOL,p); // read one line from the pipe 
if (tmp == NULL) break; // if end of pipe, break 
// don't want stored line to exceed width of screen, which the 
// curses library provides to us in the variable COLS, so truncate 
// to at most COLS characters 
strncpy(cmdoutlines[ row], 1n,COLS) ; 
cmdoutlines[row][MAXCOL-1] = 0; 
} 
ncmdlines = row; 
close(p); // close pipe 


// displays last part of command output (as much as fits in screen) 
showlastpart() 
{ 
int row; 
clear(); // curses clear-screen call 
// prepare to paint the (last part of the) 'ps ax' output on the screen; 
// two cases, depending on whether there is more output than screen rows; 
// first, the case in which the entire output fits in one screen: 
if (ncmdlines <= LINES) { // LINES is an int maintained by the curses 
// library, equal to the number of lines in 
// the screen 
cmdstartrow - 0; 
nwinlines - ncmdlines; 
} 
else { // now the case in which the output is bigger than one screen 
cmdstartrow = ncmdlines - LINES; 
nwinlines = LINES; 


} 


cmdlastrow = cmdstartrow + nwinlines - 1; 

// now paint the rows to the screen 

for (row = cmdstartrow, winrow = 0; row <= cmdlastrow; row++,winrow++) 

mvaddstr(winrow,0,cmdoutlines[row]); // curses call to move to the 

// specified position and 
// paint a string there 

refresh(); // now make the changes actually appear on the screen, 

// using this call to the curses library 


// highlight the last line 
wlnrow--; 
highlight(); 





// moves cursor up/down one line 
updown(int inc) 


{ 
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int tmp = winrow + inc; 
// ignore attempts to go off the edge of the screen 
if (tmp >= 0 8& tmp « LINES) 1 
// xewrite the current line before moving; since our current font 
// is non-BOLD (actually A NORMAL), the effect is to unhighlight 
// this line 
mvaddstr(winrow,O0,cmdoutlines[winrow]); 
// highlight the line we're moving to 
winrow - tmp; 
highlight(); 


// run/re-run "ps ax" 
rerun() 


{ 


runpsax(); 
showlastpart(); 


// kills the highlighted process 
prockill() 


{ 


char *pid; 

// strtok() is from C library; see man page 

pid = strtok(cmdoutlines[cmdstartrowtwinrow]," "); 

kill(atoi(pid),9); // this is a UNIX system call to send signal 9, 
// the kill signal, to the given process 


rerun(); 
} 
main() 
{ 

char c; 


// window setup; next 3 lines are curses library calls, a standard 
// initializing sequence for curses programs 

scrn = initscr(); 

noecho(); // don't echo keystrokes 

cbreak(); // keyboard input valid immediately, not after hit Enter 


// run ‘ps ax and process the output 
runpsax(); 
// display in the window 
showlastpart(); 
// user command loop 
while (1) (1 

// get user command 





6.2 ”调试 GUI EA 167 
- getch(); 
» (c == 'u') updown(-1); 
else if (c == 'd') updown(1); 
else if (c -- 'r') rerun(); 
else af (c == "k") prockill(); 
else break; // quit 
// restore original settings 
endwin(); 
3 — LR. NN 口 Y N 4 DM, E v REM z=% — E m M 
SANET, HAREAAEG OER, (AEE Pub otis) EET, ABE 
正确 地 反应 ， 如 图 6-1 所 示 。 
File Edit View Terminal Tabs Help 
5912 ? S 0:00 /usr/lib/nautilus-cd-burner/mapping-daemon 四 
5916 ? S 6:00 klauncher [kdeinit] 
5922 ? S 0:08 gnome-pty-helper 
5923 pts/0 Ss 0:00 -csh 
5926 ? S 0:00 kded [kdeinit] 
5949 ? S 0:00 /usr/lib/fast-user-switch-applet/fast-user-switch-app 
5951 ? Sl 0:00 /usr/bin/python /usr/lib/deskbar-applet/deskbar-apple 
5953 ? Sl 0:00 /usr/lib/gnome-applets/mixer applet2 --oaf-activate-i 
5962 pts/0 S+ 0:01 ssh laura.cs.ucdavis.edu -l matloff 
5964 ? S 0:01 /usr/lib/notification-daemon/notification-daemon 
5966 pts/1 SS+ 0:08 -csh 
6498 ? S 0:00 /bin/sh /usr/bin/firefox 
6510 ? S 0:00 /bin/sh /usr/lib/firefox/run-mozilla.sh /usr/lib/fire 
6514 ? Sl 0:52 /usr/lib/firefox/firefox-bin 
6545 pts/2 SS 二 0:08 -csh 
6971 pts/4 Ss 0:00 -csh 
7114 ? S 0:08 knotify [kdeinit] 
7117 ? S 0:03 /usr/bin/artsd -F 10 -S 4096 -s 60 -m artsmessage -l 
7118 ? S 0:00 kio file [kdeinit] file 
7146 pts/4 S 0:00 qiv 06-fig01.jpg 
7149 pts/1 S 0:07 xpdf my6.pdf 
7162 pts/4 S+ 8:88 psax 
2270 ? S« 6:00 [ata/0] 
2271 ? S« 0:00 [ata/1] - 
图 6-1 ” 某 个 终端 窗口 中 的 程序 运行 情况 
2/48 H m a Li LM `y D ÀJ PS vy 
ps ax 的 输出 是 按 进程 号 的 升序 排列 的 ， 然 而 突然 发 现 2270 显 示 在 7162 后 面 。 让 我 们 跟踪 这 


个 程序 错误 。 

















curses 程 序 是 编写 调试 类 图 书 作者 的 一 个 梦想 ， 
员 不 能 使 用 printf() 调 用 或 cout 语 句 来 输出 调试 信息 , 因为 这 样 的 输出 会 


一 起 ， 从 而 造成 混乱 。 
1. 使 用 GDB 


司 动 GDB， 但 是 相对 于 上 一 次 ， 我 们 必须 做 一 件 额外 的 事 。 我 们 必须 告 





同 的 终端 窗口 中 执行 ， 而 不 是 GDB 下 在 其 
cB. Hob. | 并 在 其 中 运行 Unix 的 tty 命 令 
ZAN X 令 的 输出 告 


在 这 种 情况 下 ， 


(gdb) tty /dev/pts/8 


因为 它 使 程序 员 不 得 不 使 用 调试 工具 。 程 序 








[中 运行 的 那个 窗口 。 可 以 使 用 GDB 的 tty 命 令 








与 程序 输出 本 身 混合 在 


诉 GDB 让 程序 在 不 
来 完成 这 件 
来 确定 该 窗口 的 ID。 


诉 我 们 ， 那 个 窗口 是 终端 号 /dev/pts/8， 因 此 在 GDB 窗 口中 输入 : 
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ALES. AREY I T-BAR T AIT Bat HP 
在 开始 前 的 最 后 一 件 事 是 : 必须 在 执行 窗口 中 键入 区 似 如 下 代码 : 
sleep 10000 


这 样 在 该 窗口 中 的 键盘 输入 会 进入 程序 ， 而 不 是 进入 shell。 








说 明 还 有 其 他 方式 可 以 处 理 将 GDB 输 出 与 程序 输出 分 开 的 问题 。 例 如 ， 可 以 先 开 始 程 序 的 执行 ， 
然后 在 另 一 个 窗口 中 激活 GDB， 将 它 附加 到 正在 运行 的 程序 后 面 。 





接 下 来 ,因为 错误 发 生 在 试图 将 光标 辐 上 移 的 时 候 ， 所 以 在 函数 updown() 的 开头 设置 一 个 断 








点 。 然 后 ， 当 键入 run 时 ,程序 会 开始 在 执行 窗口 中 执行 。 在 该 窗口 中 按 下 u 键 ，GDB 会 在 设置 的 
Ir xa b P LE. 
(gdb) x 


Starting program: /Debug/psax 
Detaching after fork from child process 3840. 


Breakpoint 1, updown (inc--1) at psax.c:103 
103 { int tmp = winrow + inc; 


首先 ， 确 认 变量 tmp 值 的 正确 性 。 
(gdb) n 


105 if (tmp >= 0 && tmp « LINES) { 
(gdb) p tmp 

$2 = 22 

(gdb) p LINES 

$3 = 24 


APtEwinrowNkzN J Gite A O FRKA. MWA DV IEE f ORE. LINESBS N24, 
因此 winrow 应 当 为 23， 因 为 是 从 0 开始 编号 的 。inc 等 于 -1《〈 因 为 我 们 在 将 光标 同上 移 ， 而 不 是 问 
下 移 )， 所 以 如 这 里 所 示 ， 确 认 了 tmp 的 人 为 22。 

现在 ， 让 我 们 来 到 下 一 行 。 

(gdb) n 

109 mvaddstr(winrow, 0, cmdoutlines[winrow]); 


(gdb) p cmdoutlines[winrow] 
$4 = " 2270 ? Ss 0:00 nifd -n\n", 'XO' «repeats 464 times» 


显然 ， 这 是 来 到 了 进程 2270 的 那 一 行 。 我 们 很 快意 识 到 源 代 但 中 的 如 下 代码 行 : 








mvaddstr(winrow,O0,cmdoutlines|winrow]); 


应 当 为 : 
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mvaddstr(winrow, 0, cmdoutlines[ cmdstartrow+winrow ] ); 


修复 了 这 个 问题 后 ， 程 序 就 能 正确 地 运行 。 
完成 后 ， 在 执行 窗口 中 按 下 Ctrl+C 组 合 键 ， 以 便 终 止 sleep 命 令 ， 并 使 shel 再 次 回 到 可 用 状 

















主意 ， 如 果 因 为 出 了 错 使 程序 过 早 结束 ， 那 么 该 执行 窗口 可 能 会 保留 部 分 非 标 准 终 端 议 置 ， 
项 cbreak 模 式 。 为 了 修复 这 一 问题 ,来 到 那个 窗口 中 并 按 下 Ctrl+J 组 合 键 , 然后 键入 单词 reset， 
之 后 绸 次 按 下 Ctrl+J 组 合 键 。 
2. 使 用 DDD 
使 用 DDD 调 试 是 什么 情况 呢 ? Tee a RT 程序 。 选 择 View 一 Execution 
Window，DDD 会 弹出 一 个 执行 窗口 。 注 意 ， 不 需要 杀 目 在 该 窗口 中 键入 sleep 命 令 ， 因 为 DDD 
Mi SIRES. GRRE AN HM nidos 








DDD: Execution Window 


11:24 metacity —sm-save-file 1049227628-1382-427732581 .ms 
0:25 gnome-power-manager 
0:26 nautilus —sm-config-prefix /nautilus-SPWf8M/ —sm-cl 
0:33 gnome-panel —sm-config-prefix /gnome-panel-61M1YE/ 一 
0:33 gnome-volume-manager —sm-config-prefix /magicdev—HDV 
ae /usr/libexec/gnome-vfs-daemon —oaf-activate-iid-OAFI 
? gnome-terminal —sm-config-prefix /gnome-terminal-iLY 
: acm in —dbus 
applet —sm-di sable 
:04 er bln a panel ten —sm-client-id 11aSed06710001 
0 /sbin/pam timestamp check -d root 
0 /usr/libexec/mapping-daemon 
0 SIS DEVE holper 


2 1 Jusr/1ibexec/onck-applet —oaf-—activate—i id=OAFIID: GN 


2 Just /ibexec/clock-applet —oaf-activate—i id=OAFIID: G 


i car E D —oaf-acti vate- 
gnome-screensaver 

Aor] diac /gun-sprvar 

[pdf lush] 

00 [pdflush][] 


DDD: /debtrg/psax.c 














int tmp = winrow + inc; 
// ignore attempts to in s the edge of the screen 
if (tmp >= 0 && tmp < LINES) £ 
// rewrite the B PRIN line before moving; since our current for 
// is non-BOLD (actually A NORMAL), the effect is to unhighlig 
// this line 
@  mvaddstr(winrow,0, cmdoutlines [winrow]); 
// highlight the line we're moving to 
winrow — tmp; 
j highlight); 
3 


// run/re-run "ps ax" 
rerun 
i 


runpsaxQ: 
showlastpartQ:; 


library "/lib/libthread db.so.1" 
(gdb) run 


30184 ? S 0:00 [pdflush]30194 ? 0:00 [pdflush]q 


Program exited normally. 

(gdb) No breakpoints or watchpoints. 

(gdb) break psax.c:115 

Breakpoint 1 at 0x8048aea: file psax.c, line 116. 
(gdb) run 

















图 6-2 ”在 DDD 中 附加 到 运行 程序 上 
照样 设置 断 点 ， 但 是 记 住 要 在 执行 窗口 中 键入 程序 输入 。 
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3. 使 用 Eclipse 

首先 要 注意 ， 在 构建 项 目 时 ， 需 要 让 Eclipse 在 make 文 件 中 使 用 -lcurses 标 志 ， 这 一 过 程 参 见 
第 5 章 的 相关 介绍 。 

这 里 也 需要 一 个 单独 的 执行 窗口 。 可 以 在 建立 调试 对 话 框 时 做 这 件 事 。 当 像 惯 常 一 样 建立 
运行 对 话 框 并 选择 Run 一 Open Debug Dialog 时 ， 我 们 将 采取 与 目前 所 采用 方法 略微 不 同 的 其 他 
方式 。 在 图 6-3 所 示 界 面 中 ， 注 意 到 除了 通常 的 选项 C/C++Local Application 外 ， 还 有 选项 C/C++ 
Attach to Local Application。 后 者 意味 着 要 让 Eclipse 使 用 GDB 能 力 来 将 它 本 身 附 加 到 一 个 已 经 运 
行 的 进程 上 《第 $ 章 讨论 过 )。 碳 击 C/C++ Attach to Local Application， 选 择 New， 并 像 以 前 一 样 继 
续 进 行 下 去 。 
































Debug 


Create, manage, and run configurations 








er Configure launch settings from this dialog: 


* - Press the 'New' button to create a configuration of the selected type. 


iz) - Press the 'Duplicate' button to copy the selected configuration. 
[c] C/C++ Attach to Local Applic 


> [E]C/C+ Local Application 
加 C/C++ Postmortem debuggt «> - Press the ‘Filter’ button to configure filtering options. 


- Press the 'Delete' button to remove the selected configuration. 


- Edit or view an existing configuration by selecting it. 


Configure launch perspective settings from the Perspectives preference page. 











Filter matched 7 of 7 items 





© 








图 6-3 ”在 Eclipse 中 附加 到 运行 程序 上 


当 开 始 实际 运行 调试 时 ， 首 先 在 一 个 单独 的 shell 窗 口中 局 动 程 序 。 (A EES id, 2E HI BE 
位 于 Eclipse 工作 衬 间 目录 中 。) 然后 像 首 次 进行 调试 运行 时 篆 做 的 那样 ， 选 择 Run 一 -Open Debug 
Dialog。 在 这 种 情况 下 ，Eclipse 会 弹出 一 个 窗口 列 出 所 有 进程 ， 要 求 你 选择 希望 GDB 附 加 到 哪个 
进程 。 这 一 过 程 如 图 6-4 所 示 ， 其 中 显示 了 psax 进 程 的 ID 为 12319〈 注 意 ， 该 程序 在 另 一 个 窗口 中 
运行 ， 这 里 局 部 地 隐 首 了 ) 。 单 击 该 进 程 ， 然 后 单 击 OK， 出 现 图 6-$ 所 示 的 情形 。 

在 图 6-$ 中 ， 可 以 看 到 程序 在 系统 调用 期 间 停 止 了 。Eclipse 发 出 通知 ， 表 明 它 没有 当前 指令 
的 源 代码 ， 但 这 是 预料 之 中 的 ， 没 有 问题 。 实 际 上 ， 这 是 在 源 文件 psax.c 中 设置 断 点 的 好 时 机 。 
设置 以 后 ， 单 击 Resume 狗 标 。Eclipse 会 一 下 运行 ， 直 到 遇 到 第 一 个 断 点 ， 然 后 可 以 照例 调试 。 
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Ele Edit View Terminal Tabs Help 
29127 ? 0:25 gname-power-manager 
29131 ? 0:26 nautilus --sm-config-prefix /nautilus-9PWf8M/ --sm-cl 
29133 ? 0:34 gname-panel --sm-config-prefix /gname-panel-6lMlYE/ -| 
29134 ? 0:33 gname-volume-manager —sm-config-prefix /magicdev- 
29137 ? 0:08 /usr/libexec/gname-vfs-daemon --oaf-activate-iid-OAFI 
29141 ? 9:39 gname-terminal --sm-config-prefix /gname-temminal-iL' 
J/RS/tmp (deleted) --window-with-profile-internal-id=Default --show-menubar 一 wo 
29145 ? Ss 0:00 bluez-pin —dbus 
29154 ? 0:02 nm-applet --sm-disable 
29157 ? ( 
29160 ? 
29169 ? 
29171 ? 
29172 pts/2 
29183 ? 
29198 pts/3 
29204 pts/4 
29208 ? 
29217 pts/5 
29239 ? 
29299 ? 
29706 ? 
30192 ? 
30194 ? 


File Edi Refactor Navigate Search Run Project Window Help 


| rje 3 Select Process 








(35: : x Select a Process to attach debugger to: 
; al 
[p mun- 11815 

[c] psax Debug (1) [C/C++ Attach to Lo B» nautilus - 29131 

B» nm-applet - 29154 

B» notification-area-applet - 29239 
B» ntpd - 2381 

B» pam-paneticon - 29157 

B» pam. timestamp. check - 29160 
L. - B» portmap - 2045 

加 psaxc x x B» psax - 12319 

B» python - 2332 














uuu uw uw uv "uou 
gegoggegvovegp 
EDESOPTSPMREESCES 

















char c; 

// window setup; next 
// initializing seque 
scrn = initscr(); 
noecho(); // don't ed 
cbreak(); // keyboarq 
// run 'ps ax' and prd scrn : WINDOW* 
runpsax(); cmdoutlines : chari 
// display in the wind 
showlastpart(); 


// user command loop 
while (1) £ 

















íg Casi x x] Tasks 区 Problems. ie) r4 E- ri ^ =) 
|C-Buik [psa] 

















|**** Build of configuration Debug for project psax **** 


| 
(make all 
|make: Nothing to be done for 'all'. 








| Launching psax Debug (1): (5796) È 





图 6-4 选择 要 将 GDB 附 加 到 的 进程 


Elle Edit View Terminal Tabs Help 

29127 ? Ss 0:25 gnome-power-manager 

29131 ? Ssl 0:26 nautilus --sm-config-prefix /nautilus-9PWf8M/ —sm-cl| 
29133 ? Ssl 0:34 gnome-panel —sm-config-prefix /gnome-panel-6lMlYE/ - 
29134 ? Ss 0:33 gnome-volume-manager --sm-config-prefix /magicdev-HDV| 
29137 ? sl 0:08 /usr/libexec/gnome-vfs-daemon --oaf-activate-iid-OAFI| 
29141 ? Ssl 9:39 gnome-terminal --sm-config-prefix /gnome-terminal-iLY| 
J/RS/tmp (deleted) --window-with-profile-internal-id-Default --show-menubar --wo| 
29145 ? 
29154 ? 
29157 ? 
29160 ? 
29169 ? 
29171 ? 
29172 pts/2 
29183 ? 
29198 pts/3 
29204 pts/4 
29208 ? 
29217 pts/5 
29239 ? 
29299 ? 
29706 ? 
30192 ? 
30194 ? 


0:00 bluez-pin --dbus 
0:02 nm-applet --sm-disable 


Debug - Source not found. - Eclipse Platform 
Eile Edit Navigate Search Run Project Window Help 
| ra D |$ O- a- | ¥ |:- t5 [ssoetu] icc 
[$5 Debug 54 [9o Breakpoints |09 Variables 23 ^. Hf Registers | mi Modules | an) 
| üp E 元 日 | 多 
| 回 psax Debug (1) [C/C++ Attach to Local Application] 
"v GP gdb/mi (12/26/07 1:45 PM) (Suspended) 
| 
| Y if Thread [0] (Suspended) 
[L Es emela ooa 
= 4__read_nocancel() 0x00ac8e93 
= 3 nc wgetch() 0x0388e02a 
三 2 wgetch() 0x0388e32c 


* 








* 








"wovpopoppopoooonpmop 
* 
Se SE eeee sf ooo = 











| [8 psaxc la 5 kernel vsyscal) 0x00ca7402 $3 EX | Ez Outline 33 
. (An outline is not available. 


| No source available for" kernel vsyscall() * 











Z Tasks | 区 Problems (J Memory 
psax Debug (1) [C/C++ Attach to Local Application] gdb (12/26/07 1:45 PM) 











图 6-5 ”在 内 核 中 集 止 





其 他 工具 





人 
"月 名 种 名 样 的 其 他 调试 工具 ,免费 的 和 需 付费 的 都 有 ， 它 们 也 可 以 帮助 防止 、 检测 和 消 
除 代码 中 的 程序 错误 。 为 了 增强 调试 技能 ， 初 学 者 程序 员 最 好 学 会 其 中 的 几 种 调试 工具 ， 了 解 
哪 种 工具 适合 于 调试 哪 种 程序 错误 ， 并 识别 发 生 程序 错误 时 使 用 其 中 哪个 工具 可 以 节省 时 间 和 
精力 。 

到 目前 为 止 我 们 的 焦点 都 集中 在 使 用 符号 调试 器 上 , 现在 我 们 把 覆盖 面 扩展 到 调试 的 其 他 方 
面 ,包括 防御 性 编程 。 本 章 专门 介绍 除 GDB 外 的 部 分 工具 和 技术 ， 这 些 工具 和 技术 对 于 在 一 开始 
防止 程序 错误 产生 以 及 程序 错误 产生 后 进行 查找 及 修复 都 是 很 有 用 的 。 


7.1 充分 利用 文本 编辑 器 


最 好 的 调试 方法 是 一 开始 就 不 要 有 编程 错误 ! 人 们 往往 最 容易 忽略 一 种 “ 预 调试 ”方式 : 充 
分 用 好 一 种 文 持 纺 程 的 编辑 内 。 

如 朱 你 伦 在 编码 上 的 时 间 很 长 ,我 们 强烈 建议 你 仔细 考 碟 选择 哪 种 编辑 左 ， 并 尽 可 能 地 充分 
学 习 将 使 用 的 编辑 右 。 这 样 做 有 两 个 忌 因 。 首 先 ， 精 通 强大 的 编辑 状 可 以 绾 短 编写 代码 所 需 的 时 
间 。 有 共有 目 动 缩 排 、 单 词 补 全 和 全 文 符号 得 询 等 特殊 功能 的 编辑 天 对 程序 员 非 常 有 利 ， 市 面 上 现 
在 有 数 种 这 样 的 编辑 硕 可 以 选择 。 其 次 ， 优 秀 编辑 喜人 而 实 可 以 带 助 编码 者 在 编号 代码 时 捕获 茶 些 
类 型 的 程序 错误 ， 这 正 是 本 市 要 介绍 的 内 容 。 

本 书 两 位 作者 都 是 使 用 Vim 编 程 的 ， 因 此 这 种 编辑 此 是 我 们 将 重点 介绍 的 内 容 。 然 而 ， 所 有 
流行 编辑 需 都 有 相似 《即便 不 相同 ) 的 功能 。 如 采 Vim 能 提供 Emacs 中 目前 没有 的 功能 ， 那 么 使 
用 Emacs 的 开 及 人 员 会 很 快 园 而 使 用 Vim， 上 反之 尔 然 。 因 此 ， 虽 然 我 们 特 指 Vim， 但 是 这 里 介绍 的 
大 部 分 内 容 也 适用 于 Emacs 等 其 他 优秀 编辑 器 。 


7.1.1 语法 突出 显示 


Vim 的 语法 突出 显示 功能 可 以 用 不 同 闫 色 或 字体 显示 程序 的 一 部 分 ， 因 此 像 关 键 子 、 类 型 标 
识 和 全、 局 部 变量 和 预 处 理 絮 指令 等 代码 元 素 部 有 各 目的 磊 色 和 子 体 模式 。 编辑 右 通过 俘 看 文件 名 
的 扩展 名 来 判断 使 用 的 是 什么 语言 , 然后 选择 相应 的 颜色 和 子 体 。 例 如, 如 下文 件 名 以 .pl 结尾 ( 表 
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示 一 个 Perl 脚 本 )， 那 么 突出 显示 单词 die ( 它 是 Perl 函 数 名 )， 而 如 果 以 .c 结 尾 ， 怠 不 突出 显示 这 个 
单词 。 

更 好 的 语 读 突 出 显示 的 名 称 是 词汇 突出 显示 ， 因 为 编辑 器 一 般 不 会 太 细致 地 分 析 语 法 。 它 不 
能 指出 在 函数 调用 中 参数 数量 有 钳 或 者 参数 类 型 有 误 。 它 只 能 理解 press 和 1joreacp 等 单词 是 Perl 天 
pi, fmt#lldimensionze Fortran ket +, JAHM HE ZR es 

即便 如 此 ， 语 法 突出 显示 对 于 捕获 人 简单 但 容易 犯 的 错误 仍然 非常 有 用 。 例 如 ， 在 我 们 的 计算 
机 上 ， 像 C 语 言 中 的 FILE 或 float 关 键 字 这 样 的 类 型 标识 符 ， 默 认 颜 色 是 绿色 。 当 眼睛 习惯 于 这 
种 学 体 和 凑 色 后 ， 无 需 经 过 不 必要 的 编 详 周期 ， 误 拼 时 就 可 以 友 现 颜色 不 一 致 ， 并 目 动 纠正 这 一 
HIR e 


使 用 语法 突出 显示 的 一 个 示例 是 检查 出 现在 make 文 件 中 的 我 们 〈 作 者 ) 喜欢 的 关键 字 。 
























































是 生成 项 目 源 代码 .c 文 件 中 的 .o 文 件 列 表 。 

TARGET = CoolApplication 

OBJS = $(patsubst %.c, 4.0, $(wildcard *.c)) 

$(TARGET): $(0BJS) 

本 书 的 作者 中 有 一 位 始终 不 记得 它 是 patsubst、pathsubst 还 是 patsub。 知 道 了 make 文 件 关 
键 字 是 用 亮色 《黄色 ) 显示 后 ， 你 能 看 出 图 7-1 所 示 代 码 行 中 哪个 版 本 是 错误 的 吗 ? 即 使 你 不 知 
道 如 何 编写 make 文 件 ， 仅 仅 依靠 突出 显示 就 可 以 一 目 了 然 ! “ 




















wildcard 
patsubst wildcard 








图 7-1 语法 突出 显示 表明 我 的 make 文 件 是 错误 的 


而 且 ， 下 向 是 一 个 更 为 姑 活 的 语法 突出 显示 示例 。 图 7-2 中 有 一 个 实 实 在 在 的 语法 错误 。 
这 时 ， 不 需要 过 多 地 思考 错误 是 什么 《或 错误 在 何 处 )， 只 要 根据 两 色 即 可 找 出 错误 。 

















if (fp -- NULL) 
puts(" bad 


exit(1); 











图 7-2 ”语法 突出 显示 揭示 了 一 个 常见 的 错误 


图 7-3 是 为 一 个 类 似 错误 的 图 示 。 试 看 根据 闫 色 找 出 销 误 。 








CD 本 书 将 此 图 转换 成 了 灰 肛 模式， 在 实际 应 用 中 用 颜色 区 别 更 容易 识别 错误 。 
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fprintf(fp, " 





"I just wrote \"4s\" which is argument Z%d\n" 








图 7-3 iB ono J AAN ie 


如 果 友 现 语法 突出 显示 模式 中 的 某 些 闫 色 难 以 阅读 ， 可 以 通过 键入 如 下 代码 关闭 突出 显示 : 





: syntax off 
再 次 打开 颜色 模式 的 命令 当然 是 : 
: syntax on 
更 好 的 办 法 是 修改 语法 文件 ,对 那 种 类 型 的 关键 字 使 用 另 一 种 更 好 的 颜色 ,但 是 这 种 办 法 超 
出 了 我 们 这 里 的 讨论 范围 。 
7.1.2 ”匹配 括号 





说 明 ”本 节 中 的 括号 是 指 圆 括号 、 方 括号 和 花 括 号 ， 即 ()、[] 和 f{1}。 


括号 不 对 称 错误 极其 帝 见 ， 且 难以 捕获 。 来 看 如 下 代码 。 
mytype *myvar; 
if ((myvar = (mytype x)malloc(sizeof(mytype))) == NULL) { 
exit(-1); 
D 
请 立即 回答 : 代码 中 国 括 号 是 否 对 称 ?“ 你 是 否 曾 不 得 不 在 带 大 量 条 件 语 句 的 代码 块 中 跟踪 
不 对 称 的 插 写 ? 或 者 有 没有 用 过 TEX? 我 们 为 过 去 丢失 了 括 写 的 LATEX 文 件 而 汗 磊 !) WRA, 
那么 你 肯定 会 同意 我 们 的 观点 : 这 完全 是 计算 机 要 负责 的 事情 , 怎 能 让 我 们 去 做 这 么 或 琐 的 工作 ! 
Vim 有 一 些 不 错 的 功能 有 助 于 检 奉 括 扎 是 个 匹配 。 
O 每 当 在 键盘 上 键入 括号 时 ，Vim 的 showmathc 选 项 使 Vim 暂 时 把 光标 放 在 匹配 的 括号 上 《如 
采 匹 配 括号 存在 并 且 在 屏幕 上 可 见 )。 通 过 设置 matchtime 变 量 ， 甚 至 可 以 控制 光标 在 匹 
配 括号 上 停留 多 长 时 间 《〈 以 十 分 之 一 秒 为 单位 )。 
a 当 光 标 在 一 个 括 写 上 时 ， 键 入 百 分 写 会 将 光标 移 到 配对 括号 上 。 这 个 命令 古 跟 躁 不 对 称 
括号 的 一 个 极 佳 方法 。 
a 将 光标 放 在 一 个 括号 上 时 ，Vim 会 突出 显示 与 其 匹配 的 另外 一 个 括号 ， 如 图 7-2 上 所 示 。 
编程 时 showmatch 选 项 是 有 用 的 ， 但 是 其 他 时 候 这 种 特性 比较 讨厌 。 可 以 使 用 目 动 命令 来 设 
置 这 个 选项 仅 在 编程 时 和 生效。 例如， 为 了 设置 showmatch 仅 适用 于 C/C++ 源 代码 文件 的 编辑 会 话 ， 
可 以 将 类 似 如 下 代码 行 放 在 .vimrc 文 件 中 (参见 Vim 的 帮助 文件 了 解 更 多 信息 )。 






























































(D 你 还 是 老 老实 实 承认 吧 ， 你 一 定 被 我 距 住 了 ， 还 以 为 它们 是 不 对 称 的 。 我 们 的 重点 不 是 指出 你 错 了 ， 而 在 于 说 明 


要 找 出 答案 是 要 伦 一 些 时 间 的 。 


au BufNewFile,BufRead *.c set showmatch 
au BufNewFile,BufRead *.cc set showmatch 








如 果 代 人 码 中 有 不 对 称 的 括 写 , EX CREE UTERO ri ERE ELATI A LC 8 BRE AR HP] 








不 对 称 括号 ， 该 怎么 办 呢 ?” 前 面 提 到 的 % 编 辑 器 命令 可 以 搜索 对 称 的 成 组 字符 。 例 如 ， 如 果 将 光 
标 放 在 左 方 括号 [上 ， 并 从 命令 模式 下 键入 %，Vim 就 会 将 光标 的 位 置 放 到 下 一 个 ] 字 符 上 。 如 果 
将 光标 放 在 右 花 括号 } 上 ， 并 调用 %， 那 么 Vim 会 将 光标 放 在 前 一 个 匹配 的 { 字 和 人 符 上 。 通 过 这 种 方 
式 ， 不 仅 可 以 验证 任何 给 定 的 圆 括号 、 花 插 号 或 方 括号 有 对 应 的 匹配 括号 ， 而 且 可 以 验证 匹配 的 
括号 符合 语义 。 使 用 Vim 的 matchpair 命 令 甚至 可 以 定义 其 他 匹配 的 “括号 ”对 ， 比 如 HTML 的 注 
释 定 界 符 <1-- 和 -->。 参 见 Vim 的 帮助 页 面 可 了 解 更 多 信息 。 


7.1.3 Vim 与 make 文 件 



































的 用 法 可 以 得 到 巨大 的 回报 。 然 而 ， 这 也 引入 了 新 的 出 错 机 会 。 如 果 使 用 make，Vim 有 几 个 有 益 
于 调试 过 程 的 功能 。 来 看 下 面 的 make 文 件 片段 。 


all: yerror.o main.o 
gcc -o myprogram yerror.o main.o 


yerror.o: yerror.c yerror.h 
gcc -C yerror.c 


main.o: main.c main.h 
gcc -c main.c 





该 make 文 件 中 有 一 个 错误 ， 但 是 很 难看 出 来 。make 对 于 格式 非常 挑 吻 。 目 标的 命令 行 必 须 以 
个 制 表 符 开头 ， 而 不 是 以 空格 开头 。 上 只 要 从 Vim 中 执行 set 1ist 命 令 ， 马 上 融 可 以 发 现 错误 所 在 。 





all: yerror.o main.o$ 
^Igcc -o myprogram yerror.o main.o$ 


yerror.o: yerror.c yerror.h$ 
^Igcc -c yerror.c$ 
$ 
main.o: main.c main.h$ 
gcc -c main.c$ 


在 list 模 式 中 ，Vim 显 示 不 可 打印 的 学 符 。 默 认 情 况 下 ， 行 末 的 字符 显示 为 $， 控 制 学 符 显 
示 为 插入 符号 〈^)， 因 此 ， 制 表 符 〈Ctrl+I) 显示 为 ^I。 因 而 可 以 将 空格 与 制 表 符 区 分 开 ， 铺 误 
很 容易 看 出 : main.o make 目 标的 命令 行 是 以 空格 开头 的 。 

使 用 Vim 的 listchars 选 项 可 以 控制 显示 内 容 。 例 如， 如 果 要 将 行 末 字符 改 成 = 而 不 是 $， 可 以 
使 用 :set listchars-eol:-. 





176 第 7 章 其 他 工具 


7.1.4 _ make 文件 和 编译 器 警告 

从 Vim 中 调用 make 非 第 方便 。 例 如 ， 不 需要 手工 保存 文件 并 在 另 一 个 窗口 中 键入 make clean, 
只 要 从 命令 模式 下 键入 :make clean 即 可 。( 一 定 要 设置 autowrite， 因 此 在 运行 make 命 令 前 ，Vim 
可 以 目 动 保存 文件 .) 一 般 而 言 ， 每 当 从 命令 模式 下 键入 如 下 代码 时 : 








:make arguments 
Vim 都 会 运行 make 并 将 orguments 传 递 给 它 。 

更 大 的 好 处 是 ， 当 从 Vim 中 编写 程序 时 ， 编 辑 器 能 捕获 编译 器 发 出 的 所 有 消 且 。 编 辑 占 理解 
GCC 输出 内 容 的 语法 ， 知 道 何 时 发 生 编 详 器 警告 或 错误 。 让 我 们 绸 看 一 下 实际 应 用 ， 请 看 代码 清 
单 7-1。 
代码 清单 7-1 main.c 


#include «stdio.h» 














int main(void) 


{ 
printf("There were %d arguments.\n", argc); 
if (argc .gt. 5) then 
print *, ‘You seem argumentative today’; 
end if 
return 0; 
} 





看 来 这 个 程序 员 既 使 用 了 Fortran 又 使 用 了 C 语 言 进行 编码 ! 假设 当前 在 编辑 main.c， 要 构建 
程序 。 从 Vim 中 执行 :make 命 令 ， 并 查看 所 有 错误 消息 (图 7-4)。 


: make 2>&1| tee /tmp/v243244/1 

gcc -std=c99 -W -wall main.c -o main 
main.c: In function 'main': 

main. 
main. 
main. 
main. 


: error: 'argc' undeclared (first use in this function) 
: error: (Each undeclared identifier is reported only once 
: error: for each function it appears in.) 

: error: expected identifier before numeric constant 

: error: ‘then’ undeclared (first use in this function) 
: error: expected ';' before ‘print’ 

:15:18: warning: character constant too long for its type 
main.c:16: error: 'end' undeclared (first use in this function) 
main.c:l1B: error: expected “;” before “if” 

make: *** [main] Error 1 

(3 of 12): error: 'argc' undeclared (first use in this function) 
Press ENTER or type command to continue] 


main. 
main. 
main. 


CO OO CO 0 GAN OO 0C 0 





图 7-4 ”错误 消息 


现在 ， 如 末 按 下 ENTER 或 空格 键 会 返回 到 编辑 程序 ， 但 是 光标 位 于 产生 第 一 条 管 告 或 错误 
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的 代码 行 上 【在 本 例 中 ， 位 于 未 声明 argc 的 消息 上 )， 如 图 7-5 所 示 。 


#include «stdio.h» 


int main(void) 
1 


@rintf ("There were sd arguments.\n", argc); 
if (argc .gt. 5) then 

print *, 'You seem argumentative today'; 
end if 


return 0; 





图 7-$ ”光标 位 于 第 一 个 错误 上 
修复 这 个 错误 后 ， 有 两 种 方式 前 进 到 下 一 个 错误 。 
口 可 以 重 做 程序 ，Vim 会 再 次 显示 其 余 和 警告 和 错误 ， 并 将 光标 重新 放 到 第 一 个 错误 上。 这 种 
方式 适用 于 构建 时 间 可 以 忽略 不 记 的 情况 ， 尤 其 是 用 一 个 按键 构建 程序 时 ， 比 如 : 


au BufNewFile,BufRead *.c map «F1» :make«CR» 

















a 也 可 以 使 用 显示 下 一 个 钳 误 或 警告 的 命令 :cnext。 类 似 地 ，: cprevious 显 示 上 一 个 错误 或 
警告 ，:cc 显 示 当 前 错误 或 警告 。 这 3 个 命令 都 很 方便 地 将 光标 放 在 “活动 ”错误 或 警告 
7.1.5 关于 将 文本 编辑 器 作为 IDE 的 最 后 一 个 考虑 事项 


虽然 精通 所 选择 的 编辑 器 是 不 言 目 明 的 ， 以 禾 人 们 往往 会 忽略 这 一 点 , 但 这 人 确实 是 学 习 在 特 
定 环 境 下 编程 的 第 一 步 。 淮 不 奔 张 地 说 ,编辑 器 对 于 程序 员 ， 束 好 比 乐 费 对 于 首 乐 家 。 即 使 是 最 
亩 有 创造 性 的 作曲 家 ， 也 需要 知道 弹 雪 乐 右 的 基本 知识 ， 才 能 实现 他 们 的 想法 ， 使 其 他 人 受 惠 。 
最 大 限度 地 学 会 使 用 编辑 器 可 以 更 迅速 地 编写 程序 ， 更 有 效 地 领悟 其 他 人 的 代码 ， 并 减少 调试 代 
ASIN ha ZEIT AY Fig PERE 

如 果 使 用 的 是 Vim， 我 们 推荐 你 看 看 Steve Oualline 所 车 的 Vi IMproved—Vim (New Riders, 
2001) 。 这 本 书 相 当 全 面 ， 写 得 也 不 错 。 (但 是 ， 它 是 为 Vim 6.0 编 瑟 的 ，Vim 7.0 及 其 后 版 本 的 
折 车 每 功能 没有 包括 进去 。) 我 们 这 里 的 目标 只 是 初步 了 解 一 下 Vim 能 够 为 程序 员 做 的 事 , 但 Steve 
的 著作 是 学 习 具 体 知 识 的 极 佳 资源 。 

作者 发 现 Vim 有 很 多 特别 有 用 的 功能 。 比 如 ， 本 来 我 们 还 想 讨 论 : 

a 用 K 答 询 手 册页 面 中 的 函数 ; 

O 用 gd 和 8gD 碍 找 变 量 声明 ; 

O 用 [^D 和 ]^D 路 到 宏 定义 ; 

a 用 ]d、]d、[D 和 ]D 显 示 宏 定义; 

O 划分 窗口 以 同时 查看 .c 和 .h 文 件 ， 以 便 检 查 原型 ; 

a 其 他 种 种 。 
但 是 本 书 是 关于 调试 的 ， 而 不 是 关于 Vim 的 。 下 和 面 继续 讨论 其 他 软件 工具 。 
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7.2. 元 分 利用 编译 器 


如 果 说 编辑 右 是 对 抗 程序 错误 的 第 一 个 武 右 ， 那么 编译 占 束 是 第 二 个 武器 。 所 有 编译 占 都 有 
能 力 扫 描 代 人 码 并 人 查找 常见 错 误 ， 但 是 通常 必须 通过 调用 适当 的 选项 来 启用 这 种 错误 检 枉 。 
除了 一 些 特殊 情况 ， 很 多 编译 器 警告 选项 〈 比 如 GCC 的 -wWtraditional 开 关 ) 都 显得 有 些 大 
材 小 用 。 然 而 ， 在 任何 时 候 ， 不 使 用 -wal1 而 使 用 GCC， 最 好 连 这 样 的 想法 都 不 要 有 。 例 如 ， 痢 
手 C 程 序 员 最 常 犯 的 错误 可 以 通过 如 下 语句 说 明 。 
if (a = b) 
printf("Equality for all!\n"); 


这 是 有 效 的 C 代 码 ，GCC 会 顺利 地 编译 它 。 变 量 a 补 赋予 值 b， 而 且 这 个 值 用 在 条 件 语句 中 。 












































然而 ， 这 肯定 不 是 程序 员 的 意思 。 使 用 GCC 的 -Wall 切换 ， 至 少 可 以 得 到 一 条 警报 ， 指 出 这 段 代 
HE HY HEA TEIR o 
$ gcc try.c 


$ gcc -Wall try.c 
try.c: In function "main': 
try.c:8: warning: suggest parentheses around assignment used as truth value 


GCC 建议 在 作为 真正 的 值 使 用 之 前 ， 将 赋值 语句 a=b 加 上 括号 ， 与 在 赋值 并 执行 如 下 比较 时 
采用 的 方式 一 样 : if ((fp = fopen("myfile", "w")) == NULL)。GCC 实 际 上 在 问 :“ 你 确认 这 
里 是 要 赋值 as=b， 而 不 是 进行 a==b 的 测试 吗 ? " 

应 该 总 是 使 用 编 详 喜 的 错误 检查 选项 。 如 末 你 在 教授 编程 诗 ， 也 应 当 要 求学 生 使 用 这 样 的 选 
项 ， 以 便 逐 渐 灌 输 民 好 的 习惯 。GCC 用 户 应 当 总 是 使 用 -wall1， 即 使 在 最 小 的 “Hello, world! " 
程序 中 也 是 如 此 。 我 们 发 现 ， 也 要 愤 用 -Wmissing-prototypes 和 -Wmissing-declarations。 实 际 
上 ， 如 果 你 有 10 分 钟 的 容 余 时 间 ， 可 以 浏览 一 下 GCC 的 手册 页 面 ， 并 读 一 下 编译 絮 警 告 部 分 ， 特 
别 是 要 在 Unix 下 编程 时 ， 很 有 必要 。 


7.3 C 语言 中 的 错误 报告 


C 语 言 中 的 错误 报告 是 使 用 名 为 errno 的 老式 机 制 完成 的 。 虽然 errno 有 点 老 态 ， 而 且 有 一 些 
不 足 之 处 ， 但 是 一 般 都 能 完成 工作 。 你 可 能 会 想 ， 既 然 大 部 分 C 函 数 都 有 方便 的 返回 值 ， 可 以 表 
明 调 用 是 成 功 还 是 失败 , 为 什么 需要 错误 报告 机 制 呢 ?答案 是 返回 值 可 以 提示 你 一 个 函数 没有 做 
ks EB EM, 但 是 它 可 能 会 也 可 能 不 会 告诉 你 为 什么 。 为 了 更 上 其 体 地 说 明 ， KAU PIRA 
E. 

FILE «fp 


fp = fopen("myfile.dat", "r"); 
retval = fwrite(&data, sizeof(DataStruct), 1, fp); 


假设 你 查看 retval 并 发 现 它 等 于 0。 从 手册 页 面 上 看 到 fwrite() 应 返回 编号 的 项 数 〈 不 是 字 
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节 或 学 符 数 )， 因 此 retval 应 为 1!。fwrite() 会 有 多 少 种 失败 的 方式 ? 很多! 首先 ， 访 文件 可 能 
Wo 或 者 你 可 能 没有 在 文件 上 写 权 限 。 然而 , 在 本 例 中 , 代码 中 有 导致 fwrite() 失 败 的 程序 错误 。 
你 能 找 出 这 个 程序 错误 吗 ?“ 像 errno 这 样 的 错误 报告 系统 可 以 提供 诊断 信息 , 帮 你 找 出 在 这 样 的 
情况 下 及 生 了 什么 事 。( 操 作 系统 也 可 能 宣告 菜 些 销 误 。) 
使 用 errno 

系统 与 库 调 用 的 失败 通常 会 设置 一 个 名 为 errno 的 全 局 定义 整数 变量 。 在 大 多 数 GNU/ Linux 
系统 上 ，errno 是 在 ppszAzcludeerrzo.1 上 声明 的 ， 因 此 ， 包 括 了 这 个 头 文 件 ， 就 不 必 在 源 代码 中 
声明 extern int errno. 

当 一 个 系统 或 库 调用 失败 时 ， 筷 将 errno 设 置 为 一 个 指示 失败 区 型 的 值 。 检 码 errno 的 什 ， 并 
采取 适当 的 动作 是 你 的 职责 。 来 看 代码 请 单 7-2。 


代码 清单 7-2  double-trouble.c 


include <stdio.h> 
#include «errno.h» 
include «math.h» 




















int main(void) 
1 
double trouble - exp(1000.0); 
if (errno) ( 
printf("trouble: %f (errno: %d)\n", trouble, errno); 
exit(-1); 


} 


return 0; 


} 


在 我 们 的 系统 上 ，exp(16ee.6) 能 够 存储 的 值 比 double 类 型 存储 的 值 大 ， 因 此 赋值 导致 浮 点 
洪 出 。 从 输出 中 可 以 看 出 ，errno 的 值 34 表 示 浮 点 洲 出 错误 。 


$ ./a.out 
trouble: inf (errno: 34) 


XIR AFERE EUCH] Y erenol] LVF ASK. Tid Top], PERRO RM AR ZUR FRI, EK errno 
设置 为 一 个 摘 述 调用 失败 原因 的 值 。 从 上 面 的 代码 中 看 到 ， 值 34 意 味 看 exp(18886.8) 的 结束 不 能 
用 double 值 表示 ， 还 有 其 他 很 多 值 表示 下 洲 、 权 限 问 题 、 文 件 未 找到 等 等 错误 情况 。 然 而 ， 在 程 
序 中 开始 使 用 errno 之 前 ， 需 要 注意 一 些 问 题 。 

首先 ， 使 用 errno 的 代码 可 能 不 是 完全 可 移植 的 。 例 如 ，ISO C 标 准 仅 定义 了 少量 错误 代码 ， 
POSIX 标 准 定 义 了 很 多 错误 代码 。 从 errno 手 册页 面 中 可 以 看 到 哪些 错误 代码 是 由 哪些 标准 定义 


























QD 我 们 用 读 模 式 打 开 了 文件 ， 然 后 试图 向 其 中 写 信息 。 
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的 。 而 且 ， 这 皮 标 准 不 是 指定 的 像 34 这 样 的 数值 来 表示 错误 代 取 ， 而 是 规定 了 符 己 错误 代码 ， 筷 


们 是 一 些 以 E 为 前 级 的 


Fe AS Ed, 


A ra EEL 


在 errno 头 文件 中 定义 (或 者 在 errno 头 文件 所 包括 的 文件 中 ) 。 








符号 错误 代码 的 值 在 不 同 平 台 上 的 唯一 一 致 之 处 是 它们 都 是 非 零 值 。 因 此 ,不 能 假定 某 个 特定 的 
值 总 是 表示 相同 的 错误 情况 。 "应 该 总 是 使 用 符号 名 指 代 errno 值 。 

除了 ISO 和 POSIX errno 值 外 ，C 库 的 特定 实现 《比如 GNU 的 glibc) 其 全 可 以 定义 更 多 errno 
fi. YEGNU/Linux 上 ，libc 的 信息 页 面 ? 的 errno 部 分 是 该 平台 上 所 有 可 用 errno 值 的 规范 来 源 : 
ISO, POSIX#ilglibc. F F411) GNU/Linux Las E peN HOR A /usr/include/asm/errno.hF Hy is 


EPIPE 32 


TER RIIDE X o 

#define 

#define EDOM 33 
#define ERANGE 34 
#define EDEADLK 35 
#define ENAMETOOLONG 36 
#define ENOLCK 37 
#define ENOSYS 38 


/* 
/* 
/* 


Broken pipe */ 

Math arg out of domain of func */ 
Math result not representable +/ 
Resource deadlock would occur +*/ 
File name too long */ 

No record locks available x/ 
Function not implemented */ 


接 下 来 ， 关 于 errno 用 法 还 有 一 些 要 点 要 记 住 。errno 可 以 通过 任何 库 函 数 或 系统 调用 设置 ， 
无 论 它 是 成 功 还 是 失败 ! 因为 成 功 的 函数 调用 也 能 够 设置 errno， 上 所 以 不 能 依赖 errno 告 诉 你 是 合 
发 生 了 错误 。 只 能 依赖 它 指出 为 什么 发 生 某 个 错误 。 因 此 ， 使 用 errno 最 安全 的 方式 如 下 ”。 

(1) 执行 对 库 或 系统 函数 的 调用 。 

(2) 使 用 函数 的 返回 值 判断 是 否 发 生 了 荣 个 错误 。 








(3) 如 末 发 生 了 茶 个 错误 ， 使 用 errno 人 确定 为 什么 友 生 这 个 错误 。 








用 伪 码 表示 如 下 。 


retval = systemcall(); 

if (retval indicates an error) { 产生 错误 
examine errno(); 检查 错误 代号 
take action(); 采取 行动 








然后 要 用 到 手册 页 和 面 。 假 设 你 在 编 但 , 到 在 调用 ptrace() 后 抛 出 一 些 错误 检查 。 第 二 步 表 示 ， 














使 用 ptrace() 的 返回 值 来 确定 有 没有 发 生 某 个 错误 。 如 末 你 像 我 们 一 样 做 ,就 不 必 记 住 ptrace() 
的 返回 值 。 可 以 怎么 做 呢 ? 每 个 手册 页 面 都 有 一 个 名 为 Return Value 的 部 分 。 可 以 快速 来 到 这 个 
页 面 ， 键 入 man function name 来 搜索 字符 串 return value. 

虽然 errno 有 一 些 缺 陷 ， 但 也 有 一 些 优势 。 

















GNU 库 在 货 后 需 做 大 量 工作 ， 当 进入 函数 时 你 存 errno， 然 后 如 朵 函数 调用 成 功 ， 将 它 恢复 





CD 例如 ， 有 些 系统 中 EWOULDBLOCK 与 EAGAIN 是 不 同 的 ， 但 是 GNU/Linux 对 这 两 者 不 加 区 别 。 
© 除了 lilbc 信 息 页 面 外 ， 也 可 以 在 系统 头 文件 中 查看 errno 值 。 这 样 不 仅 安全 而 且 自 然 ， 实 际 上 我 们 鼓励 这 样 做 ! 
© 在 代码 清单 7-2 中 对 errno 的 使 用 不 是 好 的 做 法 。 
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为 原始 值 。 如 果 函 数 调 用 成 功 ，glibc 函 数 一 般 不 会 重 写 errno。 然 而 ，GNU 还 没有 完全 普及 ， 因 
此 可 移植 代码 不 应 依赖 于 这 一 事实 。 

另外 ， 虽 然 每 次 要 三 看 特定 钳 误 代码 时 都 过 一 过 文档 太 震 琐 ,但 是 有 两 个 函数 使 得 错误 代 但 
的 解释 更 容易 : perror() 和 strerror()。 虽 然 它们 做 的 事情 相同 ， 但 是 方式 不 同 。perror() 函 数 
接受 字符 串 参 数 ， 且 没有 返回 值 。 

#include <stdio.h> 

void perror(const char +s); 























perror()MJBSCEH HREM ST. m HIperror()HE, "e ERXX SFT, Ja MRE 
个 肯 号 和 空格 ， 然 后 是 基于 errno 的 值 进 行 的 错误 次 型 描述 。 代 码 清 单 7-3 是 一 个 关于 如 何 使 用 
perror() 的 简单 示例 。 





代码 清单 7-3 perror-example.c 


int main(void) 
{ 
FILE «fp; 


fp = fopen("/foo/bar", "r"); 


if (fp == NULL) 
perror("I found an error"); 


return 0; 
} 
如 果 系 统 上 没有 文件 /foo/bar， 输 出 如 下 所 示 。 
$ ./a.out 


I found an error: No such file or directory 


perror() H4] Hz — “Son Bt eo UN ROR AEP BA f en t HR XE EAA FR, m EK 


FA TR errn RA VE Vd TETH RT] PRICE strerror() « 


include <string.h> 
char xstrerror(int errnum); 








这 个 函数 将 errno 的 值 作为 其 参数 ， 并 返回 一 个 揪 述 错误 的 字符 串 。 代 码 清单 7-4 是 一 个 关于 
如 何 使 用 strerror() 的 示例 。 


代码 清单 7-4  strerror-example.c 


int main(void) 
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i 
close(5); 


printf("%s\n", strerror(errno)); 
return 0; 


) 
该 程序 的 输出 如 下 。 


$ ./a.out 
Bad file descriptor 


7.4 更 好 地 使 用 strace 和 ltrace 


了 解 库 防 数 和 系统 调用 之 间 的 区 别 很 重要 。 库 函数 是 更 忆 级 别 的 ， 完 全 在 用 户 容 间 里 运行 ， 
并 为 程序 员 提 供 了 到 做 实际 工作 (系统 ) 的 函数 的 更 方便 的 接口 。 系 统 调用 代表 用 户 以 内 核 模式 
工作 ， 由 操作 系统 本 和 映 的 内 核 提 供 。 库 函数 printf() 看 上 去 类 似 于 一 般 输 出 函数 ,但 是 它 实 际 上 
只 是 格式 化 你 提供 给 字符 串 的 数据 ， 并 用 低级 系统 调用 write() 编 写字 人 符 串 数 据 ， 然 后 将 数据 友 
送 到 一 个 与 终端 的 标准 输出 关联 的 文件 中 。 

strace 实 用 程序 输出 程序 进行 的 各 个 系统 调用 及 其 参数 和 返回 值 。 如 果 想 查看 printf() 进 行 
了 哪些 系统 调用 ， 很 容易 做 到 。 编 写 一 个 “Hello, world! ”程序 ， 按 如 下 代码 运行 它 。 



































$ strace ./a.out 








计算 机 很 努力 地 工作 ， 只 是 为 了 回 屏 幕 上 显示 一 些 内 容 。 

strace 输 出 的 每 一 行 对 应 于 一 个 系统 调用 。strace 的 大 多 数 输出 显示 了 对 mmap() 和 open() 的 
调用 ， 采 用 类 似 1d.so 和 1ibc 这 样 的 文件 名 。 它 们 与 一 些 系统 级 操作 有 关 ， 比 如 将 磁盘 文件 映射 到 
内 存 中 及 加 载 共享 库 等 。 一 般 来 说 不 必 关 心 所 有 系统 操作 。 对 于 我 们 而 言 ， 只 要 关心 靠近 输出 末 
尾 的 两 行 即 可 。 














write(1, "hello world\n", 12hello world) = 12 
_exit(0) = ? 


这 些 代 码 行 说 明了 strace 输 出 的 一 般 格式 : 

O 被 调用 的 系统 函数 名 ; 

a [ifs c SEIT) ZR ie Hed SG 

a = 号 后 面 的 系统 调用 "返回 值 。 

MAE, BEARRA AAH E! 你 也 可 以 发 现 错误 。 比 如 ， 在 我 们 的 系统 上 ， 得 到 如 
下 代码 行 。 





open("/etc/ld.so.preload", O RDONLY) = -1 ENOENT (No such file or directory) 








(D 或 许 你 会 吃惊 地 发 现 exit() 的 返回 值 是 问号 。 这 里 strace 只 是 要 表明 exitiklel f —^voidfü. 
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open("/etc/ld.so.cache", O RDONLY) = 3 


第 一 次 调用 open() 是 为 了 打开 名 为 /etc/q.so.preload 的 文件 。 对 open() 的 调用 得 到 的 返回 值 
(应 当 是 非 负 的 文件 描述 符 ) 是 -1， 说 明 出 现 了 有 某 种 错误 。Strace 热 心地 告诉 我 们 导致 open() 失 
败 的 错误 是 ENOENT: 文件 /etc/d.so.preload 不 存在 。 

strace 告 诉 我 们 ， 对 open() 第 二 次 调用 的 返回 值 为 3?。 这 是 一 个 有 效 的 文件 摘 述 符 ， 因 此 显 
然 打 开 文 件 /etcMdso.cacjpne 的 调用 成 功 了 。 相 应 地 ，strace 输 出 的 第 二 行 上 没有 钳 误 代码 。 

顺便 说 一 下 ， 不 要 担心 像 这样 的 错误 。 你 看 到 的 内 容 与 动态 库 加 载 有 关 ， 本 质 上 并 不 是 真正 
的 错误 。 文 件 /so.preload 可 用 来 重 写 系统 的 默认 共享 库 。 由 于 我 无 意 纠 绰 这 些 事情 ， 所 以 该 文 
件 根 本 不 在 我 的 系统 上 。 当 你 逐渐 获得 strace 的 经 验 时 , 就 会 越 来 越 恒 得 如 何 过 滤 挥 这 种 “ 品 首 ”， 
将 精力 集中 于 真正 感 兴趣 的 输出 部 分 。 

strace 有 一 些 需要 在 某 个 时 候 使 用 的 选项 , 因此 我 们 这 里 简单 地 介绍 一 下 。 看 一 下 “Hello, world!” 
程序 的 完整 strace 输 出 ， 可 能 注意 到 strace 有 一 点 见长 。 将 所 有 输出 保存 在 一 个 文件 中 比试 图 在 
屏 攻 上奏 看 要 方便 得 多 。 当 然 ， 可 以 使 用 重 定 癌 stderr 的 方式 ， 但 是 也 可 以 用 -o LogfiLe 开 关 ， 
使 strace 将 其 所 有 输出 都 号 到 一 个 日 访 文件 中 。 另 外 ，strace 一 般 将 字符 串 帘 短 为 32 个 字符 。 这 
一 特性 有 时 会 隐 蔬 重要 信息 。 为 了 强制 strace 将 学 符 串 规 短 为 N 个 字符 ， 可 以 使 用 -s N 选 项 。 最 
后 ,， 如果 在 具有 子 进 程 分 支 的 程序 上 运行 strace, 可 以 用 -o Loa -ff 开关 , 将 单个 子 进程 的 strace 
输出 捕获 到 一 个 名 为 COG.xxx 的 文件 中 ， 其 中 xxx 是 子 进程 ID。 

还 有 一 个 名 为 ltrace 的 实用 工具 ， 它 类 似 于 strace， 但 它 显 示 了 库 调 用 而 不 是 系统 调用 。 
ltrace 和 strace 有 很 多 共同 的 选项 ， 因 此 知道 如 何 使 用 其 中 一 个 ， 就 很 容易 学 会 使 用 另 一 个 。 

当 你 不 具有 源 代 人 码 (甚至 具有 源 文 件 ) 时 , 如 果 要 癌 维 护 人 员 发 送 程序 错误 报告 和 诊断 信息 ， 
strace 和 1trace 实 用 程序 非常 有 用 ， 使 用 这 些 工 具有 时 比 深度 调试 代码 更 快 。 

本 书 作者 之 一 试图 在 他 自己 的 系统 上 安装 并 运行 一 个 文档 不 全 的 专 有 应 用 程序 时 , 偶尔 发 现 
了 这 些 工 具 的 有 用 性 。 当 局 动 时 ， 似 乎 不 需要 做 任何 事情 ， 应 用 程序 就 立即 返回 到 shell。 他 想 问 
公司 发 送 一 些 比 仅仅 报告 “你 的 程序 即将 退出 ”所 含 信 息 更 丰富 的 内 容 。 在 该 应 用 程序 上 运行 
strace 产 生 了 一 个 线 系 : 


open(umovestr: Input/output error 0，0 RDONLY) = -1 EFAULT (Bad address) 
运行 Itrace 产 生 了 更 多 线索 : 
fopen(NULL, "r") = 0 


从 和 输出 中 可 以 发 现 ， 这 是 对 fopen() 的 第 一 次 调用 。 应 用 程序 大 概 想 打 开 某 种 配置 文件 ， 但 
是 传递 给 fopen() 的 是 NULL。 应 用 程序 有 某 种 内 部 错误 处 理 程 序 ， 退 出 但 是 不 产生 错误 消息 。 这 
位 作者 因此 癌 公 司 发 送 了 详细 的 程序 错误 报告 , 而 事实 证 明 ， 问题 在 于 应 用 程序 配备 了 错误 的 全 
局 配置 文件 ， 它 指 同 了 一 个 不 存在 的 局 部 配置 文件 。 第 二 天 公司 就 发 布 了 一 个 补丁 。 

从 那 以 后 , 我 们 两 位 作者 发 现 strace 和 1ltrace 对 于 跟踪 程序 错误 和 解决 环 手 且 会 引起 很 多 厅 
烦 的 奇怪 行为 非常 有 用 。 
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7.5 静态 代码 检查 器 : lint 与 其 衍生 


市 面 上 有 很 多 扫描 代码 的 免费 或 商业 工具 ， 不 编译 代码 ， 仅 仅 警 告 错误 、 可 能 的 错误 和 与 严 
格 C 语 言 编 码 标准 的 差距 , 这 样 的 工具 称 为 静态 代码 检查 器 。C 语 言 的 规范 静态 代 人 码 检查 堪 由 S.C. 
Johnson 在 20 世 纪 70 年 代 末 编写 ， 称 为 lint。 编 写 lint 主 要 是 为 了 检查 函数 调用 ， 因 为 C 语 言 的 早 
期 版 本 不 支持 原型 。lint 产 生 了 很 多 衍生 静态 检查 器 。 其 中 之 一 由 美国 弗吉尼亚 大 学 计算 机 科学 
系 的 Dave Evans 编 瑟 ， 名 为 lclint， 在 Linux 等 现代 系统 上 广泛 使 用 。2002 年 1 月 ，Dave 将 lclint 
改名 为 splint， 以 强调 对 安全 编程 的 重视 (也 因为 splint 比 lcint 更 容易 拼 读 )。 

splint 的 目标 是 帮助 编写 最 具 防 御 性 、 安 全 和 无 错 的 程序 。splint 像 它 的 前 身 一 样 ， 对 于 组 
成 有 效 代 码 的 内 容 非 常 挑剔 。 “作为 练习 ， 试 找 出 代码 清单 7-$ 中 可 能 引起 警告 的 内 容 。 


代码 清单 7-5  scan.c 


int main(void) 


i 












































int i; 
scanf ("%d", &i); 


return 0; 


} 
当 通 过 splint 运 行 代 码 时 ， 发 出 一 条 警告 ， 表 示 即 将 丢弃 scanf() 的 返回 值 。” 


$ splint test.c 
Splint 3.0.1.6 --- 11 Feb 2002 





test.c: (in function main) 

test.c:8:2: Return value (type int) ignored: scanf(" 4d", &i) 
Result returned by function call is not used. If this is intended, can cast 
result to (void) to eliminate message. (Use -retvalint to inhibit warning) 


Finished checking --- 1 code warning 


所 有 splint 和 警告 都 有 固定 格式 。splint 和 警告 的 第 一 行 指出 发 生 和 警告 的 文件 名 和 函数 。 下 面 一 
行 提供 了 和 警告 的 行 号 和 位 置 。 接 看 是 警告 的 描述 ,以 及 关于 如 何 抑制 这 种 警告 的 说 明 。 可 以 看 到 ， 
调用 splint -retvalint test.c 关 闭 所 有 关于 丢弃 整数 函数 返回 值 的 党 告 。 男 外 ， 如 果 不 想 关闭 
所 有 关于 被 于 人 弃 的 int 返 回 值 的 报告 , 可 以 通 过 将 scanf() 的 类 型 强制 转换 成 void 来 抑制 对 scanf() 
的 这 一 调用 的 敬告。 也 束 是 用 (void) scanf("%d"，&i); 和 穴 换 scanf("%d"，&i);。 (还 有 男 一 种 
抑制 这 种 警告 的 办 法 ， 即 使 用 注解 ， 感 兴趣 的 读者 可 参见 splint 文 档 了 解 评 情 。) 



































(D 很 多 程序 员 将 splint 没 有 报告 警告 看 作 一 种 极 大 的 荣誉 。 当 出 现 这 种 情况 时 ， 代 码 倍 声明 为 无 lint 的 。 
(2 scanf() 的 返回 值 是 指定 的 输入 项 数 。 
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7.5.1 如 何 使 用 splint 


splint 有 很 多 开关 , 但 是 在 使 用 时 能 感 党 到 哪些 开关 能 满足 需要 。 很 多 开关 本 质 上 是 布尔 值 : 
它们 打开 或 关闭 茶 个 功能 。 在 这 些 类 型 鸭 开 关 前 面 加 上 + 吏 将 它们 打开 ， 加 上 -就 将 它们 关闭 。 例 
如 ，-retvalint 关 财 被 丢弃 的 jnt 返 回 值 的 报告 ，+retvalint 打 开 这 个 报告 (这 是 默认 行为 〉。 

有 了 两 种 使 用 splint 的 办 法 。 第 一 种 是 非 正 式 的 ， 主 要 用 在 针对 其 他 人 的 代码 或 即将 完成 的 代 
伺 运 行 splint 时 。 























$ splint «weak *.c 





如 果 没 有 +weak 开 关 ，splint 通 常 因为 太 挑剔 而 用 处 不 大 。 除 了 +weak 外 ， 还 有 3 种 级 别 的 检 
租 。 人 参见 splint 手 册 了 解 关 于 它们 的 更 多 信息 ， 这 里 傈 述 如 下 : 

O +weak， 弱 检查 ， 通 音 用 于 无 注解 的 C 代 码 ; 

Q +fstandard， 默 认 模 式 ; 

O +checks， 中 度 严 格 检 奉 ; 

Q +fstrict， 高 度 严 格 检 查 。 

splint 的 更 正式 的 用 途 涉 及 对 专门 与 splint 一 起 使 用 的 代码 进行 文档 记录 。 这 种 splint 特 有 
的 文档 称 为 注解 Cannotation) 。 注 解 是 一 个 大 主题 ， 本 书 没 有 足够 的 篇 幅 来 介绍 ， 但 是 可 以 参 
见 splint 文 档 了 解 话 细 信 息 。 


7.5.2 A 后 注意 意 事 项 


splint 文 持 很 多 《〈 但 不 是 全 部 ) C99 库 扩展 。 扬 也 不 文 持 部 分 C99 语 言 变化 。 例 如 ，splint 
不 能 处 理 复杂 数据 类 型 ， 也 不 知道 如 何在 for 循 环 的 初始 化 乾 中 定义 int 变 量 。 
splint 是 在 GNU GPL 下 发 布 的 ， 其 主页 为 http:/Wwww.splint.org/。 
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你 可 能 知道 ， 动 态 分 配 的 内 存 (Dynamically Allocated Memory, DAM) 是 程序 用 malloc() 
和 calloc() 这 样 的 函数 从 堆 中 请 求 的 内 存 。 动态 分 配 的 内 存 通常 用 于 二 又 树 和 链表 等 数据 结构 ， 
EE a one 项 后 也 在 动态 分 配 内 存 。 甚 至 标准 C 语 言 库 在 内 部 也 使 用 DAM。 
你 还 可 能 记得 ， 处 理 完 后 必须 释放 动态 内 存 。” 

Pyae DAMH BHAWAR, DAA PLR 

O 没有 释放 动态 分 配 的 内 存 。 

a 对 malloc() 的 调用 失败 (这 容易 通过 检查 malloc() 的 返回 值 来 检测 )。 

a 辣 DAM 段 之 外 的 地 址 执行 谈 和 写 操 作 。 


























CD 在 本 节 其 余部 分 ， 我 们 仅 提 及 malloc()， 但 实际 上 表示 malloc() 及 其 类 似 函 数 ， 比 如 calloc() 和 realloc()。 
D 一 个 值得 注意 的 例外 是 alloca() 函 数 ， 它 从 当前 栈 帧 请 求 动态 内 存 ， 而 不 是 从 堆 请 求 。 当 该 函数 返回 时 ， 上 自动 释 
放 帧 中 的 内 存 。 因 此 ， 你 不 必 释 放 alloca() 所 分 配 的 内 存 。 
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O 释放 DAM 段 之 后 对 DAM 区 域 中 的 内 存 执行 读 写 操作 。 

O 对 动态 内 存 的 同一 段 调用 两 次 free()。 

这 些 错误 可 能 不 会 导致 程序 以 明显 的 方式 月 波 。 让 我 们 进一步 讨论 这 个 问题 。 为 了 具体 说 明 
这 些 问 题 ， 来 看 代码 请 单 7-6。 


代码 清单 7-6 memprobs.c 


int main( void ) 


{ 








int *a = (int *) malloc( 3*sizeof(int) ); // malloc return not checked 
int «xb = (int *) malloc( 3*sizeof(int) ); // malloc return not checked 


for (int i = -1; i <= 3; ++i) 
ali] = i; // a bad write for i = -1 and 3 


free(a); 
printf("%d\n", a[1]); // a read from freed memory 
free(a); // a double free on pointer a 


return 0; // program ends without freeing xb. 


} 
第 一 个 问题 称 为 内 存 泄漏 。 例 如 ， 来 看 代码 清单 7-7。 
代码 清单 7-7 Ara bl 





int main( void ) 


i 
... lots of previous code ... 
myFunction(); 
. lots of future code ... 
} 


void myFunction( void ) 


{ 


char *name = (char *) malloc( 10*sizeof(char) ); 


Í 


当 myFunction() 执 行 时 ， 为 10 个 char 值 分 配 内 存 。 引 用 这 个 内 存 的 唯一 办 法 是 通过 使 用 
malloc() 人 返回 的 地 址 (存储 在 指针 变量 name 中 )。 如 果 由 于 某 种 原因 丢失 了 这 个 地 址 ， 比 如 
myFunction() 退 出 时 name 超 出 了 作用 域 , 而 且 没 有 在 别 的 地 方 保存 其 值 的 副本 ,那么 束 没 有 办 法 
访问 分 配 的 内 存 ， 特 别 是 无 法 释放 它 。 
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但 这 正 是 这 段 代 码 中 发 生 的 事情 。 动 态 分 配 的 内 存 不 会 像 name 等 为 栈 分 配 的 存储 器 那样 
简单 地 消失 或 超出 作用 域 ， 因 此 每 次 调用 myFunction() 时 ， 都 会 消耗 10 个 字符 的 内 存 ， 然 后 
永远 不 释放 。 最 终结 果 是 变量 堆 空 间 变 得 越 来 越 小 。 这 就 是 人 们 将 这 种 程序 错误 称 为 内 存 洪 
漏 的 原因 。 

内 存 汇 漏 减 少 了 程序 的 可 用 内 存 数量 。 在 大 多 数 现 代 系 统 (比如 GNU/Linux) 上 ， 当 存在 
内 存 汇 漏 的 应 用 程序 终止 时 ， 操 作 系 统 会 回收 这 种 内 存 。 在 老 的 系统 上 《比如 Microsoft DOS 
和 Microsoft Windows 3.1)， 洪 漏 的 内 存 会 失去 ， 直 到 重 局 系统 才 会 回收 。 无 论 系统 独 旧 ， 内 存 
泄漏 都 会 导致 系统 性 能 下 降 ， 因 为 增加 了 分 页 操作 。 随 着 时 间 的 推移 ， 它 们 会 导致 有 内 存 泄 漏 的 
程序 甚至 整个 系统 衣 溃 。 

动态 分 配 内 存 迪 到 的 第 二 个 问题 是 对 malloc() 的 调用 可 能 失败 。 发 生 这 种 情况 的 方式 很 多 。 
例如 ， 计 算 中 的 程序 错误 可 能 导致 请 求 大 量 的 或 为 负 值 的 DAM。 或 者 ， 也 许 系统 内 存 真 的 用 完 
了 。 如 果 没 有 意识 到 发 生 了 这 个 问题 ， 而 继续 试图 在 你 误 以 为 有 效 的 DAM 上 读 写 ， 则 局 面 会 雪 
上 加 霜 。 这 是 一 种 我 们 很 快 就 会 讨论 的 访问 违反 。 然 而 ， 为 了 避免 这 种 情况 ， 应 当 总 是 检查 
malloc() 有 没有 返回 非 NULL 指 针 ， 如 果 没 有 返回 这 种 指针 ， 应 尝试 优雅 地 退出 程序 。 

第 三 个 和 第 四 个 问题 称 为 访问 错误 。 这 两 个 问题 本 质 上 是 同一 件 事情 的 不 同 版 本 : 程序 试图 
在 不 可 用 的 内 存 地 址 上 读 或 写 。 第 三 个 问题 涉及 访问 DAM 段 以 上 或 以 下 的 内 存 地 址 。 第 四 个 问 
题 涉及 访问 过 去 曾经 可 用 ， 但 是 在 访问 尝试 之 前 被 释放 了 的 内 存 地 址 。 

对 DAM 的 同一 个 段 调用 两 次 free() 俗 称 为 重复 释放 (double free)。C 库 有 种 内 部 内 存 管 理 结构 
描述 分 配 的 每 个 DAM 段 边界 。 当 对 指向 动态 内 存 的 同一 个 指针 两 次 调用 free() 时 ， 程 序 的 内 存 管 
理 结构 被 破坏 ， 导 致 程序 骨 溃 : 在 有 些 情况 下 ， 甚 至 会 使 怀 有 恶意 的 程序 员 利 用 这 个 程序 错误 产生 
缓冲 区 游 出。 在 某 种 意义 上 ， 这 也 是 一 种 访问 违反 ， 但 这 是 针对 C 库 本 身 的 ， 而 不 是 针对 程序 的 。 

访问 违反 会 导致 发 生 这 两 件 事情 之 一 : 一 是 程序 骨 溃 ， 可 能 写 一 个 核心 文件 ”通常 在 收 到 
段 错误 信号 后 );， 二 是 更 糟糕 的 情况 ， 程 序 能 够 继续 执行 ， 导 致 数据 损坏 。 

在 这 两 种 结果 中 ， 前 者 绝对 要 好 得 多 。 事 实 上 ， 有 很 多 可 用 的 工具 会 导致 每 当 检 测 到 DAM 
有 任何 问题 时 ， 程 序 发 生 段 错 误 ， 并 转 储 核心 ， 这 胜 于 冒 第 二 种 情况 的 风险 ! 

你 可 能 会 问 :“ 我 到 底 为 什么 要 让 程序 发 生 段 错误 呢 ? ”要 知道 ， 如 果 处 理 DAM 的 代码 中 有 
程序 错误 ， 那 么 让 它 骨 省 是 一 件 求 之 不 得 的 事 (Very Good Thing), «Bud IITA ELE. 4 AB 
解 且 不 能 再 现 的 坏 行为 。 在 内 存 损坏 的 影响 被 感觉 到 之 前 ， 可 能 很 长 时 间 都 不 被 注意 。 通 常情 况 
下 ， 这 个 问题 在 离 程 序 错误 相当 远 的 程序 部 分 中 才 表 现 出 来 ， 所 以 非常 难以 跟踪 。 更 糟糕 的 是 ， 
内 存 损 坏 会 导致 安全 性 被 破坏 。 已 知 的 会 导致 缓冲 区 溢出 和 重复 释放 的 应 用 程序 , 在 有 些 情况 下 
会 被 恶意 黑客 用 来 运行 任意 代码 并 攻击 很 多 操作 系统 安全 漏洞 。 

另 一 方面 ， 当 程序 发 生 了 段 错误 并 转 储 了 核心 文件 ， 可 以 对 核心 文件 执行 事后 检查 ， 了 解 导 
致 该 段 错 误 的 精确 源 文件 及 代码 行 号 。 这 是 更 好 的 捕获 程序 错误 的 方式 。 

简 言 之 ， 尽 快 捕获 DAM 问 题 极其 重要 。 





























































































































CD 这 俗称 转 储 核 心 。 
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7.6.1 检测 DAM 问 题 的 策略 


本 三 讨 论 Electric Fence， 这 是 对 分 配 的 内 存 地 址 实施 “栅栏 ”防护 功能 的 库 。 访 问 这 些 栅栏 
外 的 内 存 通 常会 导致 段 错 误 和 核心 转 储 。 本 节 还 会 讨论 两 个 GNU 工 具 mtrace() 和 MALLOC_CHECK_， 
它们 同 标 准 libe 分 配 函 数 中 添加 钩子 , 以 保持 关于 当前 分 配 内 存 的 记录 。 这 样 , libec 束 可 以 对 要 读 、 
写 或 释放 的 内 存 执行 检查 。 记 住 ， 在 使 用 儿 个 软件 工具 时 要 小 心 ， 每 个 工具 都 使 用 钧 子 进行 与 堆 
相关 的 函数 调用 ， 因 为 一 个 工具 可 以 在 已 经 安装 的 钩子 上 再 安装 一 个 钩子 。” 
7.6.2 Electric Fence 


Electric Fence 〈 即 EFence)， 是 Bruce Perens 在 1988 年 编写 ， 在 GNU GPL 许可 下 发 布 的 。 那 时 
他 在 Pixar 工 作 。 当 EFence 链 接 到 代码 中 时 ， 导 致 程 序 在 发 生 下 列 情况 之 一 时 立即 发 生 段 错误 并 转 
fit ER. 

D 在 DAM 边 界 之 外 执行 读 或 与 操作 。 

a 对 已 经 释放 的 DAM 执 行 读 或 写 操作 。 

a 对 没有 指 癌 malloc() 分 配 的 DAM 的 指针 执行 free() 〈 包 括 重 复 释 放 的 特殊 情况 )。 

让 我 们 来 看 如 何 使 用 Electric Fence 跟 踪 malloc() 问 题 。 请 看 代码 清单 7-8。 


代码 清单 7-8 outOfBound.c 



































int main(void) 
{ 


int xa = (int *) malloc( 2*sizeof(int) ); 


for (int i-0; i«-2; ++i) { 
ali] = i; 
printf("%d\n ", a[i]); 
} 


free(a); 
return 0; 


} 


虽然 程序 中 包含 原型 的 malloc() 程 序 错误 , 但 是 它 可 能 会 没有 抱 候 地 正 
没有 问题 地 运行 。” 





编 详 ,其 全 很 可 能 


zi 





(D 实际 上 ， 可 以 安全 地 一 起 使 用 mtrace() 和 MALLOC_CHECK_， 因 为 mtrace() 小 心地 保留 了 它 发 现 的 任何 现 有 钧 子 。 

D 如 果 从 GDB 中 运行 链接 了 EFence 的 程序 ， 而 不 是 在 命令 行 上 调用 它 ， 那 么 程序 会 发 生 段 错误 ,不 转 储 核 心 。 这 正 
合 你 意 ， 因 为 链接 到 EFence 的 可 执行 文件 的 核心 文件 会 很 大 ， 而 且 你 不 需要 核心 文件 ， 因 为 你 总 是 位 于 GDB 中 ， 
并 正果 着 发 生 段 错误 的 源 代 人 码 文件 和 行 吕 处 。 

(3) 这 不 意味 着 malloc() 溢 出 不 会 对 代码 造成 严重 破坏 ! 本 例 主 要 为 了 说 明 如 何 使 用 EFence。 在 实际 问题 中 ， 编 写 超 
出 数组 边界 的 代码 会 导致 一 些 严重 问题 ! 
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$ gcc -g3 -Wall -std-c99 outOfBound.c -o outOfBound without efence -lefence 
$ ./outOfBound without efence 

0 

1 

2 


Pel Hes EAA a Nea — 7638 LP E AT BRE. MEA LA WIEN, (HIEHBEULH] 
这 个 程序 错误 本 喘 不 可 预知 ， 以 后 难以 确切 地 跟 踩 。 

现在 我 们 将 outofBound 与 EFence 链 接 并 运行 它 。 默 认 情 况 下 ，EFence 仪 捕获 对 动态 分 配 区 域 
的 最 后 一 个 元 素 之 外 的 读 或 写 操作 。 这 总 味 看 当 试 图 写 入 a[2] 时 outofBound 应 当 出 现 段 错 谋 。 

















$ gcc -g3 -Wall -std-c99 outOfBound.c -o outOfBound with efence -lefence 
$ ./outOfBound with efence 
Electric Fence 2.1 Copyright (C) 1987-1998 Bruce Perens. 
0 
1 
Segmentation fault (core dumped) 


果然 ，EFence 发 现 写 操作 超过 了 数组 的 最 后 一 个 元 素 。 

虽然 不 小 心 访问 数组 第 一 个 内 存 之 前 的 内 存 〈 比 如 指定 “元 素 ”a[-1]) BUTS DU ANS 
见 ， 但 是 铺 误 的 索引 计算 可 能 会 导致 这 样 的 情况 。EFence 提 供 了 一 个 名 为 EF_PROTECT_ 
BELOW 的 全 局 int 变 量 。 当 将 这 个 变量 设置 为 1 时 ，EFence 仅 捕获 数组 下 游 ,不 检查 数组 上 洪 。 














extern int EF PROTECT BELOW; 


double myFunction( void ) 


i 
EF PROTECT BELOW - 1; // Check from below 
int xa = (int *) malloc( 2*sizeof(int) ); 
for (int i--2; i«2; +i) { 
ali] = i; 
printf("%d\n", a[i]); 
} 
} 


由 于 EFence 的 这 种 工作 方式 ,我 们 可 以 捕获 试图 访问 超出 动态 分 配 的 块 的 内 存 , 或 者 试图 访 
问 分 配 的 块 之 前 的 内 存 ， 但 古 不 能 同时 捕获 这 两 种 类 型 的 访问 错误 。 
为 了 更 彻底 地 捕获 程序 错误 ,应当 使 用 EFence 运 行程 序 两 次 : 一 次 在 默认 模式 下 检查 动态 内 
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存 上 溢 ， 另 一 次 将 EF_PROTECT_BELOW 设 置 为 1 来 检查 下 游 。? 

除了 EF_PROTECT_BELOW 外 ， 可 以 设置 FFence 的 另外 几 个 全 局 整 型 变量 ， 以 控制 其 行为 。 

口 EF_DISABLE_BANNER。 将 这 个 变量 设置 为 1 可 以 隐藏 运行 与 EFence 链 接 的 程序 时 显示 的 横 
幅 。 我 们 不 建议 这 样 做 ， 因 为 横幅 可 以 提醒 你 EFence 已 链接 到 应 用 程序 ， 不 应 将 可 执行 
文件 用 于 生产 版 本 ， 因 为 链接 到 EFence 的 可 执行 文件 较 大 ， 运 行 较 慢 ， 并 且 会 产生 非常 
大 的 核心 文件 。 

口 EF_PROTECT_BELOW。 正 如 我 们 讨论 过 的 ，EFence 默 认 检 查 DAM 上 洪 。 将 这 个 变量 设置 为 
会 使 EFence 检 查 内 存 下 汶 。 

O EF_PROTECT_FREE。 默 认 情 况 下 ，EFence 不 检查 对 已 被 释放 DAM 的 访问 。 将 这 个 变量 设置 
成 1 会 启用 对 已 释放 内 存 的 保护 。 

DEF_FREE_WIPES。 默 认 情 况 下 ，EFence 不 修改 存储 在 已 释放 内 存 中 的 值 。 将 这 个 变量 议 置 
成 非 零 值 导 臻 EFence 填 充 在 释放 前 用 6xbd 动 态 分 配 的 内 存 的 段 。 这 样 使 EFence 更 容易 检 
测 出 对 被 释放 的 内 存 的 不 当 访 问 。 

DEF_ALLON_MALLOC_6。 黑 认 情 况 下 ，EFence 会 捕获 对 malloc() 的 参数 为 0 的 任何 调用 〈 即 对 
零 字 布 内 存 的 任何 请 求 )。 其 基本 诛 理 是 编写 次 似 char *p = (char *) malloc(8); 的 代码 
可 能 是 程序 错误 。 然 而 ， 如 果 由 于 某 些 原因 ， 你 的 意思 真 的 是 癌 malloc() 传 递 0， 那 么 将 
这 个 变量 设置 为 非 零 值 会 使 EFence 忽 略 这 样 的 调用 。 

作为 练习 ， 请 编写 一 个 访问 已 释放 的 DAM 的 程序 ， 并 使 用 EFence 捕 获 这 一 错误 。 

每 当 修改 这 些 全 局 变量 之 一 时 ， 都 需要 重新 编译 程序 ， 这 很 不 方便 。 笠 好 还 有 一 种 更 容易 的 
方式 。 也 可 以 设置 与 EFence 的 全 局 变量 同名 的 shell 环 境 变 量 。EFence 会 检测 这 些 环境 变量 ， 并 采 
取 适 当 的 动作 。 

作为 示范 , 我 们 将 环境 变量 EF_DISABLE_BANNER 设 置 为 禁止 显示 EFence 横 幅 页 面 。( 正 如 以 前 
所 提 到 的 ， 你 不 应 这 样 做 。 ) 如 果 使 用 Bash， 执 行 : 


$ export EF DISABLE BANNER=1 



























































C shell 用 户 应 执行 : 

% setenv EF DISABLE BANNER 1 

然后 重新 运行 代码 清单 7-8， 并 确认 禁用 了 横幅 。 

另 一 个 技巧 是 在 调试 会 话 期 间 从 GDB 中 设置 EFence 变 量 。 这 样 之 所 以 可 行 ， 是 因为 EFence 
变量 是 全 局 的 。 然 而 ， 这 也 意味 着 程序 需要 在 执行 中 ， 却 被 暂停 了 。 
7.6.3 用 GNU C 库 工具 调试 DAM 问 题 

如 果 使 用 的 是 GNU 平 台 ， 比 如 GNU/Linux， 那 么 可 以 用 一 些 GNU C 库 特有 的 功能 (类 似 于 
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参阅 EFence 的 手册 页 面 的 “Word-Alignment and Overrun Detection” 和 “Instructions for Debugging Your 
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EFence) 2KdiB 3x2 VERSES E. RIITTA Pe 

1. MALLOC CHECK EnvironmentZ4? = 

GNU C 库 提供 了 一 个 名 为 MALLOC_CHECK_ 的 环境 变量 ， 像 EFence 一 样 ， 可 用 来 捕获 DAM 访 问 
违反 ， 但 是 对 它 的 使 用 不 需要 重新 编译 程序 。 这 些 设置 及 其 效果 如 下 所 示 。 

D 6 一 一 关闭 所 有 DAM 检 查 〈 如 果 没 有 定义 变量 ， 也 是 这 种 情况 )。 

a 1 一 一 当 检 测 到 堆 损坏 时 ， 显 示 关 于 stderr 的 诊断 消息 。 

a 2 一 一 当 检 测 到 堆 损 坏 时 ， 立 即 退 出 程序 并 转 储 内 存 。 

a 3 一 一 1 和 2 的 综合 效果 。” 

由 于 MALLOC_CHECK_ 是 环境 变量 ， 因 此 使 用 它 得 找 与 扒 相 关 的 问题 很 简单 ， 只 要 键入 如 下 代 
码 即 可 : 


$ export MALLOC CHECK =3 





























虽然 MALLOC_CHECK_ 比 EFence 用 起 来 更 方便 , 但 是 它 有 几 个 严重 的 缺陷 。 第 一 , MALLOC. CHECK -. 
仪 在 下 次 执行 与 堆 相 关 的 函数 (比如 malloc()、realloc() 或 free()) 时 出 现 非 法 内 存 访问 的 情 
况 下 才 报 告 动 态 内 存 问题 。 这 意味 看 你 不 仅 不 知道 有 问题 代码 的 源 文件 和 行 号 ， 而 且 经 常 甚 全 不 
知道 是 哪个 指针 引起 了 问题 。 为 了 说 明 这 一 点 ， 来 看 代码 清单 7-9。 








代码 清单 7-9  malloc-check-0.c 


ı int main(void) 

>d 

3 int *p = (int *) malloc(sizeof(int)); 
4 int *q = (int *) malloc(sizeof(int)); 


for (int i-0; i«400; ++i) 
pli] = i; 


11 free(q); 
T free(p); 
13 return 0; 


14 } 








$ MALLOC CHECK =3 ./malloc-check-o 
malloc: using debugging hooks 


D 这 在 作者 的 系统 上 没有 文档 说 明 。 感 谢 Gianluca Insolvibile 阅 读 glibc 源 代码 并 发 现 这 个 选项 ! 
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free(): invalid pointer 0x8049680! 

Aborted (core dumped) 

$ gdb malloc-check-O core 

Core was generated by ^./malloc-check-O'. 
Program terminated with signal 6, Aborted. 
Reading symbols from /lib/libc.so.6...done. 
Loaded symbols for /lib/libc.so.6 

Reading symbols from /lib/ld-linux.so.2...done. 
Loaded symbols for /lib/ld-linux.so.2 

#0 0x40046a51 in kill () from /lib/libc.so.6 
(gdb) bt 

#0 0x40046a51 in kill () from /lib/libc.so.6 

#1 0x40046872 in raise () from /lib/libc.so.6 
#2  0x40047986 in abort () from /lib/libc.so.6 
#3 0x400881d2 in IO file xsputn () from /lib/libc.so.6 
#4 0x40089278 in free () from /lib/libc.so.6 

#5 Ox080484bc in main () at malloc-check-0.c:13 








在 调试 这 个 只 有 14 行 的 程序 时 ， 你 还 能 够 应 付 这 一 缺 聊 ,但 是 当 使 用 真正 的 应 用 程序 时 ， 这 

可 能 是 一 个 严重 问题 。 然 而 ， 知 道 DAM 问 题 存 在 ， 这 本 身 是 一 个 有 用 信息 。 
其 次 ， 这 暗示 了 如 果 访 问 错 误 发 生 后 没有 调用 与 堆 相 关 的 函数 ， 那 么 MALLOC_CHECK_ 根 本 不 

全 报告 错误 ， 

再次 ，MALLOC_CHECK_ 铺 误 消 息 似 乎 含义 不 是 那么 明显 。 虽 然 前 面 的 代码 清单 有 一 个 数组 上 
溢 铺 误 ， 但 是 这 个 错误 消 县 仅仅 指出 是 “无 效 指针 ”。 这 从 技术 上 来 说 是 正确 的 ， 然 而 用 处 不 大 。 

最 后 ， 对 于 setuid 和 setgid 程 序 是 禁用 MALLOC_CHECK_ 的 ， 因 为 怀 有 恶意 的 人 可 以 利用 这 种 功 
能 组 合 进行 安全 攻击 。 可 以 通过 创建 文件 /etc/suid-debue 来 重新 启用 。 这 个 文件 的 内 容 不 重要 ， 重 
要 的 是 存在 这 个 文件 。 

总 而 言 之 ，MALLOC_CHECK_ 是 一 种 方便 的 工具 ， 在 代 人 码 开 发 期 间 用 来 捕获 与 堆 相 关 的 编程 故 
障 。 然 而 ， 如 果 怀 疑 有 DAM 问 题 ， 或 者 要 仔细 扫描 代码 查找 可 能 存在 的 DAM 问 题 ， 束 应 当 使 用 

万 一 个 实用 工具 。 

2. 使 用 mcheck() 工 具 

除 MALLOC_CHECK 外 还 可 以 用 mcheck() 工 具 。 我 们 发 现 这 个 方法 比 MALLOC_CHECK 更 令 人 满 
Feo mcheck() Bm 78 A: 



































#include «mcheck.h» 
int mcheck (void (*ABORTHANDLER) (enum mcheck status STATUS)) 


在 调用 任何 与 堆 相 关 的 函数 前 必须 调用 mcheck()， 盏 则 对 mcheck() 的 调用 会 失败 。 因 此 ， 应 
当 在 程序 中 非常 早 的 时 候 调 用 这 个 冰 数 。 一 旦 成 功 调 用 mcheck() 束 会 返回 9， 如 果 调 用 得 太 述 则 
会 返回 -1。 

检测 到 DAM 中 的 不 一 致 时 会 调用 用 户 提 供 的 函数 ， 参 数 *ABORTHANDLER 是 指 癌 这 个 函数 的 指 
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针 。 如 果 将 NULL 传 递 给 mcheck()， 则 使 用 上 默认 处 理 程序 。 与 MALLOC_CHECK 一 样 ， 这 个 默认 处 理 
程序 也 癌 stdout 输 出 一 条 错误 消息 , 并 调用 abort() 来 产生 核心 文件 ,与 MALLOC_CHECK _ 不同 的 是 ， 
这 条 错误 消息 是 有 用 的 。 例 如 ， 在 代码 清单 7-10 中 ， 超 出 动态 分 配 的 段 的 末尾 。 


代码 清单 7-10 mcheckTest.c 








int main(void) 
i 
mcheck (NULL) ; 
int «p = (int *) malloc(sizeof(int)); 
p[1] = 0; 
free(p); 
return 0; 


| 
它 产 生 如 下 所 示 的 错误 消息 。 


$ gcc -g3 -Wall -std-c99 mcheckTest.c -o mcheckTest -lmcheck 
$ ./mcheckTest 

memory clobbered past end of allocated block 

Aborted (core dumped) 


HABA AY A) [n] RU 2S ELITS] TED PER T A e 

3. 使 用 mtrace() 捕 获 内 存 泄漏 和 重复 释放 

mtrace() 工 具 是 GNU C 库 的 一 部 分 ， 用 来 捕获 C 和 C++ 程序 中 的 内 存 刘 漏 和 重复 杰 放 。 
mtrace() 的 使 用 涉及 5 个 步骤 。 

(1) 将 环境 变量 MALLOC_TRACE 设 置 成 有 效 的 文件 名 。 这 是 mtrace() 在 其 中 放置 消息 的 文件 
名 。 如 条 没有 将 该 变量 设置 为 有 效 文件 名 ， 或 者 没有 设置 该 文件 的 写 权 限 ， 那 么 mtrace() 将 什 
么 也 不 做 。 

(2) 包括 mcheck.h 尖 文件 。 

(3) 在 程序 最 上 方 调 用 mtrace()。 其 原型 为 : 


#include «mcheck.h» 
void mtrace(void); 























(4) 运行 程序 。 如 果 检 测 到 任何 问题 , 会 用 一 种 非 人 类 可 读 的 形式 将 它们 记 到 MALLOC_TRACE 
所 指向 的 文件 中 。 另 外 ， 为 了 安全 起 见 ，mtrace() 不 会 对 setuid 或 setgid 可 执行 文件 做 任何 事情 。 

(5) mtrace() 配 备 了 一 个 称 为 mtrace 的 Perl 肢 本， 用 来 分 析 日 忘 文件 ， 并 将 其 内 容 显 示 为 人 类 
可 读 的 标准 输出 形式 。 

注意 ， 这 里 还 调用 muntrace() 来 停止 内 存 跟 蹊 ， 但 是 glibc 信 息 页 面 建议 不 要 使 用 这 个 调用 。 
也 可 能 对 程序 使 用 了 DAM 的 C 库 会 得 到 通知 , 只 有 当 main() 已 返回 或 进行 了 对 exit() 的 调用 后 程 
序 才 会 结束 。 在 发 生 这 件 事 之 前 ，C 库 为 程序 使 用 的 内 存 不 会 被 释放 。 在 该 内 存 释放 之 前 对 
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muntrace() AY va H n] Be S SICH] BT ER VA o 

看 一 个 徐 单 示例 。 代 码 清单 7-11 说 明 mtrace() 捕 获 到 了 这 两 个 问题 。 在 下 面 的 代码 中 ， 我 们 
一 下 没有 释放 第 6 行 上 p 指 问 的 内 存 ， 在 第 10 行 上 我 们 在 指针 q 上 调用 free()， 尽 管 它 没有 指 问 动 
态 分 配 的 内 存 。 


代码 清单 7-11  mtracel.c 











ı int main(void) 


» { 


8 int *p, *q; 


mtrace(); 


r Lint +} m 


at — 1 alla 
ü P= ALE *J tidis 


rfcizen 
VL Lottery 


10 free(q); 
H return O; 


s) 
设置 MALLOC_TRACE 变 量 后 编译 该 程序 并 运行 它 。 


$ gcc -g3 -Wall -Wextra -std-c99 -o mtrace1 mtrace1.c 
$ MALLOC TRACE-"./mtrace.log" ./mtrace1 

p points to 0x8049a58 

q points to 0x804968c 





如 果 看 一 下 mtrace./og 的 内 容 ， 会 发 现 它 根本 没有 意义 。 然 而， 运行 Perl 脚 本 mtrace() 产 生 了 
无 法 理解 的 输出 。 


$ cat mtrace.log 

- Start 

@ ./mtrace1: (mtrace+0x120)[0x80484d4] + 0x8049a58 0x4 
@ ./mtrace1: (mtrace+0x157)[0x804850b] - 0x804968c 
p@satan$ mtrace mtrace. log 

- 0x0804968c Free 3 was never alloc'd 0x804850b 


Memory not freed: 


Address Size Caller 
0x08049a58 Ox4 at Ox80484dA 


然而 ， 这 只 是 略 有 儿 助 ， 因 为 虽然 mtrace() 友 现 了 问题 ， 但 是 它 将 它们 报告 成 了 指针 地 址 。 
所 斑 ，mtrace() 能 够 做 得 更 好 。mtrace() 脚 本 也 将 该 可 执行 文件 的 文件 名 作为 可 选 的 参数 。 使 用 
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这 个 选项 ， 得 到 了 行 写 以 及 相关 的 问题 。 


- 0x0804968c Free 3 was never alloc'd 
/ home/p/codeTests/mtrace1.c:15 


Address Size Caller 
0x08049a58 Ox4 at /home/p/codeTests/mtrace1.c:11 


现在 ， 这 正 是 我 们 想 看 到 的 信息 ! 

像 MALLOC_CHECK_ 和 mcheck() 实 用 程序 一 样 ，mtrace() 不 能 防止 程序 朋 泪 。 它 仅仅 是 检查 问 
题 。 如 果 程 序 朋 涡 , mtrace() 肯 定 会 有 一 部 分 输出 丢失 或 错乱 , 这 可 能 产生 令 人 迷惑 的 错误 报告 。 
处 理 这 种 情况 的 最 佳 办 法 是 捕获 并 处 理 段 错误 ， 以 便 让 mtrace() 优 雅 地 终止 。 代 人 码 清单 7-12 说 明 
了 如 何 做 这 件 事 。 


代码 清单 7-12  mtrace2.c 














void sigsegv handler(int signum); 


int main(void) 


1 


int xp; 


signal(SIGSEGV, sigsegv handler); 
mtrace(); 
p = (int x) malloc(sizeof(int)); 


raise(SIGSEGV); 
return 0; 


} 


void sigsegv handler(int signum) 

{ 
printf("Caught sigsegv: signal %d. Shutting down gracefully.\n", signum); 
muntrace(); 
abort(); 





} 





对 其 他 语言 使 用 
GDB/DDD/Eclipse 








们 一 般 都 知道 GDB 和 DDD 是 C/C++ 程序 的 调试 器 ， 但 是 它们 也 可 以 用 于 其 他 语言 的 开 
发 。Eclipse 最 初 是 为 Java 开 发 设计 的 ,但 是 它 为 其 他 很 多 语言 提供 了 插件 。 本 章 将 介绍 
如 何 使 用 这 种 多 语言 能 力 。 

GDB/DDD/Eclipse 不 一 定 是 哪 种 特定 语言 的 “最 佳 ” 调 试 器 。 每 种 特定 的 语言 都 有 很 多 优秀 
调试 工具 可 用 。 然而 我 们 要 指出 的 是 , 无 论 使 用 哪 种 语言 编写 程序 , 不 管 是 C、C++、 Java. Python, 
Perl 还 是 其 他 可 使 用 这 些 工 具 的 语言 /调试 器 ， 如 果 能 够 使 用 相同 的 调试 界面 ， 那 将 是 相当 棒 的 。 
DDD wid HT ATA -o 

LiPyton A) fill. Python fie FE 2&4 4 E145 — 7r fa] FE T OCA I i iat. TARE, 虽然 也 存在 很 多 
优秀 的 Python 特 有 的 GUI 调 试 器 和 IDE， 但 是 另 一 种 选择 是 使 用 DDD 作 为 Python 内 置 调试 右 的 界 
面 。 这 样 可 以 既 获 得 GUI 的 便利 ， 又 仍然 使 用 进行 CC++ 编 但 时 熟悉 的 界面 DDD). 

这 些 工 具 的 多 语言 功能 是 如 何 实现 的 呢 ? 

O 虽然 GDB 最 初 是 作为 CC++ 的 调试 器 创建 的 ， 但 是 后 来 使 用 GNU 的 人 也 提供 了 一 敌 Java 

TRES: GOJ. 
口 DDD 本 身 不 是 调试 器 ， 而 是 GUI 可 以 通过 它 来 加 底层 调试 器 发 布 命令 。 对 于 C/C++， 该 底 
层 调试 器 通常 是 GDB。 然 而 ，DDD 经 党 可 用 来 作为 其 他 语言 特有 的 调试 占 的 前 靖 。 

O Eclipse 也 只 是 前 端 。 各 种 语言 的 插件 使 它 可 以 开发 与 调试 用 那些 语言 编写 的 代码 。 

本 章 将 概述 在 Java、Perl、Python 和 汇编 语言 中 用 这 些 工 具 进 行 调试 。 应 当 指 出 的 是 ， 在 各 
种 情况 下 ， 都 有 一 些 别 的 功能 是 这 里 没有 涉及 的 ， 我 们 建议 你 探索 你 在 使 用 的 语言 的 详细 信息 。 


8.1 Java 


以 一 个 操作 链表 的 应 用 程序 为 例 。 这 里 ， 类 Node 的 对 象 表示 数字 链表 中 的 节点 ， 以 键 值 升序 
排列 。 这 个 列表 本 身 是 类 LinkedList 的 对 象 。 测 试 程序 TestLL.java 从 命令 行 读 入 数字 ， 建 立 一 个 
由 这 些 数学 组 成 的 排序 列表 ， 然 后 输出 这 个 排序 列表 。 下 面 是 源 代码。 
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TestLL.java 


i // usage: [java] TestLL list of test integers 


ho 


s // simple example program; reads integers from the command line, 
1 // storing them in a linear linked list, maintaining ascending order, 
s  // and then prints out the final list to the screen 


7 public class TestLL 


a 1 
9 public static void main(String[] Args) { 
(0 int NumElements = Args. length; 
T LinkedList LL = new LinkedList(); 
T for (int I = 1; I <= NumElements; I++) { 
13 int Num; 
14 // do C's "atoi()', using parseInt() 
15 Num = Integer.parseInt(Args[I-1]); 
16 Node NN = new Node(Num); 
17 LL.Insert(NN); 
18 } 
19 System.out.println(" final sorted list:"); 
20 LL.PrintList(); 
2] } 
zj 
LinkedList.java 


ı // LinkedList.java, implementing an ordered linked list of integers 


3 public class LinkedList 


y 4 
5 public static Node Head - null; 

ü 

7 public Linkedlist() { 

8 Head - null; 

a } 

10 

il // inserts a node N into this list 
T public void Insert(Node N) { 

13 if (Head == null) { 

id Head = N; 

is return; 


16 } 
17 if (N.Value < Head.Value) { 
18 N.Next - Head; 
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19 Head = N; 
20 return; 
21 } 
29 else if (Head.Next == null) { 
23 Head.Next = N; 
?4 return; 
25 } 
26 for (Node D = Head; D.Next != null; D = D.Next) { 
27 if (N.Value < D.Next.Value) { 
98 N.Next = D.Next ; 
2) D.Next - N; 
30 return; 
31 } 
32 } 
33 } 
34 
35 public static void PrintList() { 
36 if (Head == null) return; 
37 for (Node D - Head; D !- null; D - D.Next) 
38 System.out.println(D.Value); 
39 } 
40 } 
Node.java 


1 // Node.java, class for a node in an ordered linked list of integers 


nz 


s public class Node 

iog 

5 int Value; 

6 Node Next; // "pointer" to next item in list 


8 // constructor 

9 public Node(int V) { 
i0 Value = V; 

H Next = null; 


i o} 





该 代码 中 有 一 个 程序 错误 ， 让 我 们 试 着 找 出 这 个 错误 。 
8.1.1 直接 使 用 GDB 调 试 Java 


人 们 一 般 将 Java 看 作 一 种 解释 语言 ， 但 是 使 用 GNU 的 GCJ 编 译 器 ， 可 以 将 Java 源 代码 编译 为 
AS HALAS TRG. 这样 可 以 使 Java 应 用 程序 运行 得 快 得 多 , 这 也 意味 着 可 以 使 用 GDB 进 行 调试 。( 确 
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保 使 用 GDB 5.1 或 者 更 高 的 版 本 。) GDB 本 号 或 者 通过 DDD， 比 JBD (Java Development Kit 配 套 的 
Vines) 功能 更 强大 。 例 如 ，JDB 不 允许 设置 条 件 断 后 ， 而 前 面 介绍 过 ， 这 是 一 种 基本 GDB 调 试 
技术 。 因 此 不 仅 可 以 少 学 一 人 m noi 天 得 更 好 的 功能 性 。 

首先 将 应 用 程序 编 详 成 本 地 机 喜 

$ gcj -c -g Node. java 


$ gcj -c -g LinkedList. java 
$ gcj -g --main=TestLL TestLL.java Node.o LinkedList.o -o TestLL 








这 几 行 代码 类 似 于 普通 GCC 命令 ， 除 了 -main=TestLL 选 项 外 ， 它 指定 函数 main() 将 作为 程序 
执行 入 口 点 的 类 。【〔 我 们 一 次 编译 两 个 源 文件 。 我 们 发 现 ， 为 了 人 确保 GDB 正 确 地 跟踪 源 文件 ， 这 
是 必需 的 。) 针对 测试 输入 运行 程序 后 得 到 如 下 结 


$ TestLL 8 5 12 
final sorted list: 








5 
8 


不 知 什么 原因 ,输入 的 12 消 失 了 。 让 我 们 来 看 如 何 使 用 GDB 来 查找 这 个 程序 错误 。 像 惯 第 一 
样 局 动 GDB， 首 和 完 告诉 它 ， 当 Java 的 无 用 单元 收集 操作 产生 Unix 信 号 时 ， 不 要 集 止 或 向 屏 大 输出 
公告 。 这 种 动作 是 一 种 干扰 ， 可 能 干扰 使 用 GDB 单 步调 试 的 能 力 。 


(gdb) handle SIGPWR nostop noprint 





Signal Stop Print Pass to program Description 

SIGPWR No No Yes Power fail/restart 
(gdb) handle SIGXCPU nostop noprint 

Signal Stop Print Pass to program Description 

SIGXCPU No No Yes CPU time limit exceeded 





现在 ,既然 第 一 个 明显 的 程序 错误 是 输入 中 的 数学 12， 那么 让 我 们 在 Insert() 方 法 开头 设置 
一 个 断 点 ， 这 个 市 后 键 值 上 的 条 件 等 于 12。 


(gdb) b LinkedList.java:13 if N.Value == 12 
Breakpoint 1 at Ox8048bb4: file Linkedlist.java, line 13. 


另外 ， 也 可 以 尝试 如 下 命令 : 

(gdb) b LinkedList.java:Insert if N.Value -- 12 

然而 ， 有 虽然 这 在 以 后 会 起 作用 ， 但 这 时 还 没有 加 载 LinkedList 关 。 
现在 在 GDB 中 运行 程序 : 


(gdb) r 8 5 12 
Starting program: /debug/TestLL 8 5 12 
[Thread debugging using libthread db enabled] 
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[New Thread -1208596160 (LWP 12846)] 
[New Thread -1210696800 (LWP 12876)] 
[Switching to Thread -1208596160 (LWP 12846)] 


Breakpoint 1, LinkedList.Insert(Node) (this=@47da8, N-011a610) 
at LinkedList.java:13 

13 if (Head == null) { 

Current language: auto; currently java 


根据 确认 原则 ， 让 我 们 确认 要 插入 的 值 为 12。 
(gdb) p N.Value 


$1 - 12 

SE EE AI. 

(gdb) n 

17 if (N.Value < Head.Value) { 

(gdb) n 

22 else if (Head.Next == null) { 

(gdb) n 

26 for (Node D = Head; D.Next !- null; D = D.Next) { 
(gdb) n 

27 if (N.Value < D.Next.Value) { 

(gdb) p D.Next.Value 

$2 = 8 

(gdb) n 

26 for (Node D = Head; D.Next !- null; D = D.Next) { 
(gdb) n 

12 public void Insert(Node N) { 

(gdb) n 

33 } 

(gdb) n 

TestLL.main(java.lang.String[]) (Args=@ab480) at TestLL.java:12 
12 for (int I = 1; I <= NumElements; I++) { 

这 不 好 。 我 们 过 历 了 所 有 Insert()， 而 没有 插入 12。 

再 仔细 一 点 查看 ， 你 将 发 现在 LinkedList.java 中 第 26 行 开始 的 循环 ， 我 们 将 要 插入 的 值 12 与 





列表 中 目前 的 两 个 值 5 和 8 相 比 较 ， 发 现在 这 两 种 情况 下 狐 值 较 大 。 这 实际 上 束 古 错误 所 在 。 我 们 
没有 处 理 在 其 中 要 插入 的 值 大 于 列表 中 所 有 已 存在 的 值 的 情况 。 所 以 需要 在 第 31 行 后 面 添加 代码 
来 处 理 这 种 情况 。 
else if (D.Next.Next == null) { 
D.Next.Next - N; 


return; 


} 
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纠正 后 ， 可 以 发 现 程 序 工作 正常 了 。 
8.1.2 ”使 用 DDD 与 GDB 调 试 Java 

如 果 使 用 DDD 作 为 GDB 的 界面 ， 那 么 这 些 步 又 会 容易 得 多 ， 也 更 令 人 愉快 (同样 假定 源 代 
人 码 是 用 GCJ 编 译 的 )。 像 惯常 一 样 启 动 DDD。 

$ ddd TestLL 

(忽略 关于 临时 文件 的 错误 消息 。) 

源 代码 没有 立即 出 现在 DDD 的 源 文本 窗口 中 ， 因 此 可 以 首先 使 用 DDD 的 控制 台 。 


(gdb) handle SIGPWR nostop noprint 

(gdb) handle SIGXCPU nostop noprint 

(gdb) b LinkedList.java:13 

Breakpoint 1 at 0x8048b80: file LinkedList.java, line 13. 
(gdb) cond 1 N.Value -- 12 

(gdb) r 8 5 12 


这 时 源 代 但 出 现 了 ， 当 前 正 位 于 断 点 上 。 然 后 可 以 像 惯 单一 样 继续 进行 DDD 操 作 。 
8.1.3 使 用 DDD 作 为 JDB 的 GUI 
DDD 可 以 直接 与 Java Development Kit 的 JDB 调 试 占 结合 起 来 使 用 。 如 下 命令 : 


$ ddd -jdb TestLL.java 








会 启动 DDD， 人 然后 DDD 调 用 JDB。 
然而 ， 我 们 发 现 它 变 得 很 厂 烦 ， 因 此 不 建议 采用 DDD 的 这 种 用 法 。 
8.1.4 用 Eclipse 调试 Java 


如 果 最 切 下 载 并 安装 的 是 Eclipse 的 适用 C/C++ 开发 版 本 ， 则 需要 获取 JDT (Java Development 
Tools) 插件 。 

基本 操作 与 前 面 描述 C/C++ 时 一 样 ， 但 是 要 注意 如 下 几 点 。 

a 当 创 建 项 目 时 , 确保 选择 Java Project. 另外 , 建议 选中 Use Project Folder As Root for Sources 
and Classes 复 选 框 。 

O 使 用 导航 器 的 Package Explorer 视 图 。 

O 一 旦 保存 (或 导入 )， 源 文件 束 会 刻 编 译 成 .class。 

a 当 创 建 运行 对 话 框 时 ， 右 击 Java Application 并 选择 New。 在 标 为 Main Class 的 空格 中 ， 填 
宛 在 其 中 定义 main() 的 类 。 

a 当 创 建 调试 对 话 框 时 ， 选 中 Stop in Main 复 选 框 。 

O 在 调试 运行 中 ，Eclipse 会 在 main() 之 前 停止 。 只 要 单 击 Resume 投 钮 珑 可 以 继续 。 

图 8-1 显 示 了 Eclipse 中 的 一 个 典型 Java 调 试 场景 。 注 意 ， 与 CUC++ 一 样 ， 按 下 N 劳 边 的 下 三 角 














\\ 
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形 ， 在 Variables 视 图 中 会 显示 节点 N 的 值 。 


v debug TestLL/LinkedList.java - Eclipse Platform 
File Edit Navigate Search Project Run Window Help 
| E &| B | O- @ |@ g |g Fe © Ge o- 








v [3]TestLL [Java Application] 
v GP TestLL at localhost:40734 i LinkedList (id=18) 
"v af Thread [main] (Suspended) Node (id-24) 
LinkedList.Insert(Node) line: 25 
= TestLL.main(String[)) line: 17 
喝 /opt/jre1.6/bin/java (Dec 29, 2007 10:50:13 PM) 


四 TestLL.java 


Head = N; warwrtkerxwt =” 


return; 
) vV © LinkedList 
else if (Head.Next == null) { o *Head : Node 


Head.Next - N; 
return; © ^ LinkedList() 








Insert(Node) 


} 
for (Node D = Head; D.Next != null; D=D.Next) { : 
if (N.Value « D.Next.Value) { 9 "PrintList) 
N.Next - D.Next; 
D.Next - N; 
return; 








K|8-1 Eclipse 中 的 Java 调 试 
8.2 Perl 
我 们 将 使 用 下 面 的 示例 textcount.pI!， 它 计算 文本 文件 上 的 统计 信息 。 


1! #! /usr/bin/perl 





s # reads the text file given on the command line, and counts words, 
1 8 lines, and paragraphs 


&  open(INFILE,GARGV[0]); 


s $line count = 0; 
o $word count = 0; 
i $par count = 0; 


i2?  $now in par = 0; # not inside a paragraph right now 


4 while ($line = «INFILE») 1 

is $line _count++; 

16 if ($line ne "\n") { 

17 if ($now in par == 0) { 
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18 $par_count++; 

19 $now_in par = 1; 

20 } 

21 @words on this line = split(" ",$line); 

29 $word count += scalar(@words on this line); 
23 } 

24 else { 

25 $now in par = 0; 

26 } 

27 } 


ə print "$word count $line count $par_count\n"; 


该 程序 统计 在 命令 行 上 指定 文件 中 的 单词 、 行 和 段落 数量 。 作 为 测试 用 例 ， 我 们 使 用 如 下 所 
示 的 文件 festat《〈 你 可 能 筑 得 似曾相识 ， 诛 来 它 征 本 书 第 1 章 中 的 内 容 )。 








In this chapter we set out some basic principles of debugging, both 
general and also with regard to the GDB and DDD debuggers. At least one 
of our rules’ will be formal in nature, The Fundamental Principle of 
Debugging. 


Beginners should of course read this chapter carefully, since the 
material here will be used throughout the remainder of the book. 


Professionals may be tempted to skip the chapter. We suggest, though, 
that they at least skim through it. Many professionals will find at 
least some new material, and in any case it is important that all 
readers begin with a common background. 


EREA 2A, Debugging WI PA4T, ProfessionalsBi IA —41 « 4EXXh X 4r E3811 
我 们 的 Perl 代 码 后 得 到 的 得 出 应 如 下 所 示 。 


$ perl textcount.pl test.txt 








102 14 3 
ME, RERI Sw Jelse fij. 
else { 
$now in par = 0; 
j 
\end{Code} 


The output would then be 


\begin{Code} 
$ perl textcount.pl test.txt 
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102 14 1 


XE 


X 
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单词 数量 和 行 数 是 正确 的 ， 但 段落 数 是 错误 的 。 


通过 DDD 调 试 Perl 
Perl 有 它 自己 的 内 置 调试 器 ， 这 个 调试 器 通过 命令 行 上 的 -d 选 项 调用 。 


$ perl -d myprog.pl 


这 个 内 置 调试 器 的 一 个 缺陷 是 它 没 有 GUI， 但 是 通过 DDD 运 行 调 试 器 可 以 弥补 这 一 缺陷 。 让 
我 们 看 看 可 以 如 何 使 用 DDD 查 找 程 序 错 误 。 刍 入 如 下 代码 来 调用 DDD: 


$ ddd textcount.pl 


DDD H ZntE 
表示 当前 的 位 置 。 
Hl E XE XT FF. Program > Run 来 指定 命令 行 参 数 test.txt， 并 填充 弹出 窗口 的 Run with 
Arguments 部 分 ， 如 图 8-2 所 示 。( 在 DDD 控 制 台 上 可 能 会 发 现 “...do not know how to create a new 
TTY...” 这 样 的 消息 ， 和 忽略 它 。) 另外 ， 可 以 通过 在 DDD 控 制 台 中 简单 地 键入 如 下 Perl 调 试 命令 
来 “手工 ”设置 参数 : 


IE, 
AS 


| 这 是 Perl 肢 本 ， 调 用 Perl 调 试 右 ， 并 在 第 一 行 可 执行 代码 上 设置 绿色 的 篆 





@ARGV[O] = "test.txt" 





DDD: /home/nm/Debug/Book/textcount. pl 


#! /usr/bin/per1l 


# reads the text file given on the command line, and counts words, 


f lines, and paragraphs 


open(CINFILE,GARGV [0]) ; 
X DDD: Run Program 
$l1ine count = 0; 
$word count = 0; 
$par count - 0; 


$now in par = 0; # not insid 
while ($line = «INFILE») 1 
$1ine_count++; 
if ($line ne "\n") { 
if ($now in par == 0) 
$par_count++; 
$now_in_par = 1; 


Qwords on this line = s 
$word count += scalar( 


else ( 
$now in par = 0; 


} 


print "$word count $line count $par_count\n"; 


Editor support available. 


Enter h or ^h h' for help, or “man perldebug' for more help. 


DB<> 
" 





图 8-2 ”设置 命令 行 参 数 


[x] 
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由 于 错误 在 于 段落 数量 中 ， 因 此 让 我 们 看 看 当 程 序 达 到 第 一 段 末 尾 时 发 生 了 什么 事 。 这 会 在 
ll PATE EC Je ARA 


$words on this line[O] eq "Debugging." 


让 我 们 在 while 循 环 开头 附近 放置 一 个 断 点 。 我 们 这 样 做 的 方式 与 前 面 见 过 的 用 于 C/C++ 程 
序 的 方式 完全 相同 ， 通 过 右 击 这 一 行 ， 选 择 Set Breakpoint。 

还 应 在 这 个 断 点 上 加 上 上 面 的 条 件 。 同 样 ， 单 击 Source 一 Breakpoints， 硝 傈 突出 显示 
Breakpoints and Watchpoints 弹 出 窗口 中 的 给 定 断 点 ， 然 后 单 击 Props 图 标 。 之 后 填充 所 需 的 条 件 ， 
见 图 8-3。 























DDD: Jhome/nmpDebug/Book/textcount.pl 


Buords. on. this. ling 79 的 @ ga 


#! /usr/bin/perl 


$par_count++; 
$now_in_par = 1; 


} 
Qwords. on this line = split" 
$word count += scalar(Gwords o 


} 
else { 
$now_in_par = 0; 


} 


print "$word_count $1ine count $par_ 


by typing tty, and disconnect the shell from TTY by sleep 1000000. 
[6525-»26525]DB«- b 16 
[6525-26525]DB«» 


7 








图 8-3 在 断 点 上 设置 条 件 


选择 Program 一 Run。( 我 们 不 选择 Run Again， 因 为 这 似乎 把 人 市 到 了 Per 内 部 。) 我 们 将 鼠标 
移 到 使 它 指向 变量 gwords_on_this_line 的 实例 ，DDD 会 照常 弹出 黄色 框 显 示 该 变量 的 值 。 因 此 
我 们 确认 断 点 条 件 满足 ， 见 匈 8-4。 

当 按 下 Next 儿 次 来 跳 过 文本 文件 中 的 空白 行 后 ， 你 将 注意 到 我 们 也 跳 过 了 下 面 这 行 。 























$par count; 


我 们 原来 预期 使 用 上 面 这 行 代码 递增 段落 数 。 回 尖 来 看 ， 这 是 由 于 变量 $now_in_par 为 0 引起 
的 ， 通 过 观察 ， 很 快 可 以 明白 如 何 修 复 这 一 程序 错误 。 











206 | $ 83 对 其 他 语言 使 用 GDB/DDD/Eclipse 
DDD: /home/nm/Debug/Book/textcount. pl 


Bwords. on. this, lin& 39 
#! /usr/bin/perl 


f reads the text file given on the command line, and counts words, 
# lines, and paragraphs 


openCINFILE, QARGV [0] ) ; 
$line count - 0; 

$word count - 0; 

$par. count = 0; 


$now in par = 0; # not inside a paragraph right now 





while ($line = «INFILE») { 
$1ine_count++; 
if ($line ne "An"» 4 
if ($now in par 220) ( 
$par_count++; 
$now_in_par = 1; 


F 
Qwords on this line = split(" ",$line); 
$word count += scal[t*Debugging. "5|! s-11ne5; 
$ 
else { 
$now in par = 0; 


} 


J 


print "$word count $1ine count $par_count\n"; 


by typing tty, and disconnect the shell from TTY by sleep 1000000. 


[6525-26525-»6525]DB«» c 
[6525-»6525—»6525]DB«» 





K]8-A 到 达 断 点 时 的 情况 


在 DDD 中 , 也 可 以 通过 选择 Source 一 Breakpoints， 突 出 显示 断 点 ， 然 后 单 击 所 需 选 项 来 禁用 、 
局 用 或 删除 断 点 。 
如 果 修 改 了 源 文件 ， 则 必须 通知 DDD 通 过 选择 File 一 Restart 来 更 新 其 自身 。 


8.2.2 ”在 Eclipse 中 调试 Perl 


为 了 在 Eclipse 中 开发 Perl 代 码 , 我 们 需要 PadWalker Perl 软 件 包 (可 以 从 CPAN 下 载 )， 以 及 Perl 
的 EPIC Eclipse 插件 。 

同样 ， 基 本 操作 与 以 前 对 C/C++ 的 摘 述 相同 ， 但 是 注意 以 下 儿 点 。 

O 创建 项 目 时 ， 选 择 Perl Project. 

a 使 用 Navigator 作 为 导航 器 视图 。 

O 没有 构建 阶段 ， 因 为 Perl 不 产生 字 节 码 。 

a 在 Debug 透 视图 中 ， 只 能 在 Variables 视 图 中 访问 变量 的 值 ， 而 不 能 通过 在 源 代 人 码 视图 中 的 

忌 标 动作 来 访问 ， 而 且 只 能 访问 局 部 变量 。 

需要 在 源 代 码 中 各 个 变量 的 第 一 个 实例 中 使 用 Perl 的 my 关键 字 来 查看 全 局 变量 〈 这 时 会 用 到 
PadWalker £4, )。 

Kl8-5 zs SAS HU Perl i ibe Ae TERR BR 18] ee PS my ES o 
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v debug - textcount/textcount.pl - Eclipse Platform 


File Edit Source Refactor Navigate Search Project Run Window Help 
| &| & | # Ov ar |@ | 4 | Sir 5 











Y Ytextcount [Perl Local] 
v i$ Per Debugger Q- $line count 
"v 只 «suspended» Main Thread 
= textcount.pl[line: 9] 


»5 Perl Debugger 





# inputs the text file given on the command line, and counts words, 
# lines and paragraphs 


open(INFILE ,@ARGV[0]); 

my $line_count = 0; 

my $word_count = 0; 

my $par count = 0; 

my $now in par = 0; # not inside a paragraph right now 


mhila (Pismo — zZTMPTTT«^ f 
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8.3 Python 
与 上 面 的 Perl 示 例 一 样 ， 让 我 们 以 #fpy 为 例 ， 统 计 文本 文件 中 的 单词 数量 、 行 数 和 上 段落 数量 。 





i class textfile: 

2 ntfiles = 0 # count of number of textfile objects 
à def init (self,fname): 

1 textfile.ntfiles += 1 

z self.name = fname # name 

6 self.fh = open(fname) 

7 self.nlines = O # number of lines 


8 self.nwords = 0 # number of words 
9 self.npars = O # number of words 
10 self.lines = self.fh.readlines() 

T self.wordlineparcount() 

|? def wordlineparcount(self): 


E "finds the number of lines and words in the file" 
T self.nlines - len(self.lines) 

I5 inparagraph = O 

6 for l in self.lines: 

i7 w = l.split() 
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18 self.nwords += len(w) 
19 if 1 == "\n: 

20 if inparagraph: 

21 inparagraph = 0 
99 elif not inparagraph: 
23 self.npars += 1 

24 inparagraph = 1 


26 def grep(self,target): 





27 “prints out all lines in the file containing target” 
28 for 1 in self.lines: 
29 if l.find(target) >= 0: 
30 print 1 
TT print i 
32 
» def main(): 
84 t = textfile('test.txt') 
35 print t.nwords, t.nlines, t.npars 
36 
3 if name == ' main ' 
38 main() 
一 定 要 在 源 代码 程序 末尾 包括 如 下 所 示 的 两 行 代码 。 
if name ==‘ main ': 
main() 


说 明 如果 你 是 经 验 丰 富 的 Python 程序 员 ， 很 可 能 了 解 这 个 模式 。 如 果 你 不 熟悉 Python， 那 么 我 解释 
一 下 ， 这 几 行 代码 是 需要 测试 Python 程序 是 本 身 被 调用 来 还 是 被 作为 模块 导入 到 了 其 他 某 个 
程序 中 。 这 是 通过 调试 器 运行 程序 时 产生 的 一 个 问题 。 


8.3.1 在 DDD 中 调试 Python 


Python 的 基本 调试 器 是 PDB (pqb.py)， 这 是 一 个 基于 文本 的 工具 。 它 的 实用 性 通过 使 用 DDD 
作为 GUI 前 站 而 得 到 大 大 增强 。 

然而 在 开始 前 要 先 关 注 几 个 问题 。 为 了 使 DDD 正 确 地 访问 PDB，Richard Wolff 编 写 了 PYDB 
(pydb.py)， 这 是 对 PDB 临 微 修 改 后 的 版 本 。 然 后 用 -pydb 选 项 运行 DDD。 但 是 随 看 Python 的 演变 ， 
原来 的 PYDB 不 再 能 正确 地 工作 。 

一 个 好 的 解决 方案 羡 Rocky Bernstein 开 有 的 。 在 编号 本 书 时 《2007 年 夏天 )， 据 说 他 的 修改 
后 的 PYDB 有 了 很 大 扩展 ， 将 包括 到 DDD 的 下 一 个 版本 中 。 另 外 ， 可 以 使 用 Richard Wolff 捉 供 的 
补丁 。 需 要 的 文件 如 下 : 

O Attp://heather.cs.ucdavis.edu/matloff/Python/DDD/pydb.py 
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O Attp://heather.cs.ucdavis.edu/matloff/Python/DDD/pydbcmd.py 

QO Attp://heather.cs.ucdavis.edu/ matloff/Python/DDD/pydbsupt.py 

将 这 些 文件 放 在 某 个 目录 中 , 假设 是 /usr/bin， 为 它们 赋予 执行 权限 ， 并 创建 一 个 由 下 和 面 这 行 
代码 组 成 的 文件 ， 命 名 为 pydb: 

/usr/bin/pydb.py 

一 定 也 要 赋 子 pydp 执 行 权 限 。 完 成 这 件 事后 就 可 以 将 DDD 用 于 Python 程序 ， 然 后 激活 PDDD: 


$ ddd --pydb 











说 明 ”如果 弹 出 一 个 错误 窗口 ， 表 明 “PYDB 不 能 尼 动 >， 可 能 是 因为 路 径 问 题 。 例 如 ， 可 能 有 另 一 
个 名 为 pydb 的 文件 。 只 要 确保 在 搜索 路 径 中 DDD 的 该 文件 是 第 一 个 遇 到 的 文件 。 


然后 打开 源 文件 tfpy， 可 以 通过 选择 File 一 Open Source 并 双击 文件 名 ， 也 可 以 通过 在 控制 台 
中 键入 如 下 代码 : 


file tf.py 


(Pdb) 提示 符 最 初 可 能 不 会 显示 ， 但 是 无 论 如 何 都 要 键入 你 的 命令 。 

源 代码 会 出 现在 源 文 本 窗口 中 , 然后 可 以 像 惯 津 一 样 设置 断 点 。 假设 在 如 下 这 行 代 人 码 上 设置 
了 一 个 断 点 : 

w = l.split() 


为 了 运行 程序 ， 单 击 Progr am 一 Run， 在 Run 弹 出 窗口 中 设置 任何 命令 行 参数 ， 然 后 单 击 Run。 
在 蛙 击 Run 按 钮 后 ， 需 要 单 击 Continue 两 次 。 这 是 因为 搬 层 PDB/PYDB 调 试 器 的 工作 机 理 。( 如 末 
忘记 了 做 这 件 事 ，PDB/PYDB 会 在 DDD 控 制 台中 提醒 你 。) 
要 对 源 代码 进 行 修 改 ， 则 在 控制 台中 执行 file 命 令 ， 或 者 选择 Source 一 Reload Sources EK 
运行 的 断 点 会 你 留 。 
8.3.2 ”在 Eclipse 中 调试 Python 
再 次 ，Python 的 过 程 类 似 于 其 他 语言 。 这 当然 说 明了 让 同一 个 工具 适用 于 多 种 语言 的 价值 。 
一 是 学 会 了 如 何在 一 种 语言 中 使 用 某 种 工具 ， 就 很 容易 为 另 一 种 语言 使 用 这 种 工具 。 关 于 Python 
特有 的 要 点 需 记 住 如 下 内 容 。 
O 需要 安装 Pydev 搬 件 。 安 装 后 ,选择 Window 一 Preferences 一 Pydev， 并 将 Python 解释 器 的 位 
‘a. Cbüusr/bin/python) 通知 Eclipse。 
O 使 用 Pydev Package Explorer 作 为 导航 器 透视 图 。 
a 因为 没有 创建 永久 学 市 码 文件 ， 所 以 没有 构建 过 程 。 
a 在 建立 运行 /调试 对 话 框 时 ， 注 意 如 下 内 容 : 用 和布 望 从 中 开始 执行 的 源 文件 名 项 元 Main 
Module。 在 Arguments 选 项 卡 中 ， 在 Base Directory 中 填充 具有 输入 文件 的 目录 (或 者 这 些 
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目录 树 的 根 目 录 )， 并 将 命令 行 参 数 放 在 Program Arguments 中 。 
O 在 Debug 透 视图 中 ， 变 量 的 值 只 能 通过 Variables 视 图 访问 ， 而 且 仅 限于 访问 局 部 变量 。 
Eclipse 优 于 DDD 的 一 个 主要 优点 是 ，DDD 使 用 的 底层 调试 引擎 PDB 不 适用 于 多 线程 程序 ， 
而 Eclipse 适用 于 这 种 程序 。 


8.4 调试 SWIG 代码 


SWIG (Simplified Wrapper and Interface Generator) 是 一 种 流行 的 开源 工具 , 用 来 将 Java、Perl、 
Python 和 才干 其 他 解释 语言 与 CC++ 接 合 。 大 部 分 Linux 发 行 版 都 包括 SWIG， 也 可 以 从 网 上 下 载 。 
它 允 许 使 用 解释 语言 编写 应 用 程序 的 大 部 分 代码 ， 并 与 程序 员 用 C/C++ 编写 的 特定 部 分 结合 ， 从 
而 增强 性 能 。 

问题 在 于 如 何在 这 样 的 代码 上 运行 GDB/DDD。 下 徊 我 们 将 提供 一 个 使 用 Python 和 C 的 小 示 
例 。C 代 码 将 定理 一 个 先进 先 出 (FIFO〉》 队 列 。 


i // fifo.c, SWIG example; manages a FIFO queue of characters 






































[Evi 


s char *fifo; // the queue 


int nfifo = 0, // current length of the queue 
6 maxfifo; // max length of the queue 


s int fifoinit(int spfifo) // allocate space for a max of spfifo elements 
o { fifo = malloc(spfifo); 
10 if (fifo == 0) return 0; // failure 


11 else 1 

E maxfifo - spfifo; 

13 return 1; // success 
id } 

5 oj 


5; int fifoput(char c) // append c to queue 
is ( if (nfifo < maxfifo) 1 

19 fifo[nfifo | = C; 

20 return 1; // success 

21 } 


99 else return 0; // failure 


» ) 
24 

» char fifoget() // delete head of queue and return 
o { char c; 

27 if (nfifo > 0) { 

98 c = fifo[0]; 


39 memmove ( fifo,fifo«1,--nfifo); 
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30 return C; 

31 } 

32 else return 0; // assume no null characters ever in queue 
as] 





除了 .c 文 件 外 ，SWIG 还 需要 一 个 接口 文件 ， 在 本 例 中 是 fifo.i。 访 文件 由 全 局 符号 组 成 ， 用 
SWIG 样 式 列 出 一 次 ， 用 C 样 式 列 出 一 次 。 
%module fifo 


“extern char «fifo; 

extern int nfifo, 
maxfifo; 

extern int fifoinit(int); 


extern char «fifo; 

extern int nfifo, 
maxfifo; 

extern int fifoinit(int); 

extern int fifoput(char); 

extern char fifoget(); 


为 了 编译 该 代码 ， 先 运行 swig， 它 产生 一 个 额外 的 .ce 文 件 和 一 个 Python 文件 。 然 后 使 用 GCC 
和 1d 产 生 一 个 .so 共享 的 目标 动态 库 。 下 面 是 Make 文 件 。 


 fifo.so: fifo.o fifo wrap.o 
gcc -shared fifo.o fifo wrap.o -o fifo.so 








fifo.o fifo wrap.o:  fifo.c fifo wrap.c 
gcc -fPIC -g -c fifo.c fifo wrap.c -I/usr/include/python2.4 


fifo.py fifo wrap.c:  fifo.i 
swig -python fifo.i 


这 个 库 被 作为 一 个 模块 导入 Python， 如 下 面 的 测试 程序 中 所 示 。 


# testfifo.py 





import fifo 


def main(): 
fifo.fifoinit(100) 
fifo.fifoput('x') 
fifo.fifoput('c') 
c - fifo.fifoget() 
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print c 
c = fifo.fifoget() 
print c 
if name == ' main ': main() 


该 程序 的 输出 应 为 “x” 和 “c”， 但 是 我 们 发 现 输出 为 空 : 


$ python testfifo.py 


$ 
为 了 使 用 GDB, 记 住 你 在 运行 的 实际 程序 是 Python 解释 器 python。 因 此 在 该 解释 器 上 运行 GDB。 
$ gdb python 


ME, RITKE PS FIFO R RAAR TAR SPR A IMR. AL El] Python fie FE at 
执行 了 如 下 代码 才 会 发 生 加 载 : 

import fifo 

幸而 ， 我 们 可 以 要 求 GDB 在 库 中 的 某 个 函数 上 停止 : 


(gdb) b fifoput 
Function "fifoput" not defined. 
Make breakpoint pending on future shared library load? (y or [n]) y 











Breakpoint 1 (fifoput) pending. 


现在 运行 解释 器 ， 其 参数 为 测试 程序 testfifo.py。 


(gdb) r testfifo.py 

Starting program: /usr/bin/python testfifo.py 
Reading symbols from shared object read from target memory...(no debugging 
symbols found)...done. 

Loaded system supplied DSO at 0x164000 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 

[Thread debugging using libthread db enabled] 
[New Thread -1208383808 (LWP 15912)] 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 


Breakpoint 2 at Ox3b25f8: file fifo.c, line 18. 
Pending breakpoint "fifoput" resolved 
[Switching to Thread -1208383808 (LWP 15912)] 


Breakpoint 2, fifoput (c-120 'x') at fifo.c:18 


18 { if (nfifo « maxfifo) { 
你 现在 可 以 做 已 经 非常 熟悉 的 事 : 
(gdb) n 

19 fifo[nfifo] = c; 
(gdb) p nfifo 

$1 0 

(gdb) c 

Continuing. 


Breakpoint 2, fifoput (c-99 'c') at fifo.c:18 


18 { if (nfifo « maxfifo) { 
(gdb) n 

19 fifo[nfifo] = c; 
(gdb) p nfifo 

32 50 








问题 就 在 这 里 。 每 次 试图 向 队列 中 添加 字符 时 ， 只 要 重 写 前 面 添加 的 字符 。 第 19 行 应 为 : 
fifo[nfifo++] = c; 
一 旦 进行 了 修改 ， 代 码 就 能 正确 工作 。 
汇编 语言 
GDB 和 DDD 在 调试 汇编 语言 代码 时 极其 有 用 。 本 节 将 摘 述 要 记 住 的 一 些 特殊 情况 。 
以 文件 testfs 中 的 代码 为 例 。 


ı 4 the subroutine findfirst(v,w,b) finds the first instance of a value v 
ə # in a block of w consecutive words of memory beginning at b, returning 
s 4 either the index of the word where v was found (0, 1, 2, ...) or -1 if 
1 8 v was not found; beginning with start, we have a short test of the 

5  €& subroutine 


7 „data # data segment 


8 Xi 
9 .long 1 
10 long 

n .long 3 


12 .long 168 
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这 是 Linux Intel 沪 编 语 言 ， 使 用 的 是 AT&T 语 法 ,但 是 熟悉 其 他 Intel 语 法 的 用 户 应 当 发 现 该 代 
iy A Eb EH]. (GDB 命 令 set disassembly-flavor intel 5 $45 GDB 以 Intel 语 法 显示 其 
disassemble 命 令 的 所 有 和 输出， 这 类 似 于 NASM 编 译 柄 所 使 用 的 语法 。 顺 便 提 及 ， 由 于 这 是 Linux 


大 大 
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.long 8888 
.text # code segment 
.globl start # required 
Start: # required to use this label unless special action taken 
# push the arguments on the stack, then make the call 
push $x«4 # start search at the 5 
push $168 # search for 168 (deliberately out of order) 
push $4 # search 4 words 
call findfirst 
done: 
movl Zedi, “edi # dummy instruction for breakpoint 
findfirst: 
# finds first instance of a specified value in a block of words 
# EBX will contain the value to be searched for 
# ECX will contain the number of words to be searched 
# EAX will point to the current word to search 
# return value (EAX) will be index of the word found (-1 if not found) 
# fetch the arguments from the stack 
movl 4(%esp), %ebx 
movl 8(%esp), %ecx 
movl 12(%esp), “eax 
movl %eax, “edx # save block start location 
# top of loop; compare the current word to the search value 
top: cmpl (%eax), %ebx 
jz found 
decl %ecx # decrement counter of number of words left to search 
jz notthere # if counter has reached 0, the search value isn't there 
addl $4, “eax # otherwise, go on to the next word 
jmp top 
found: 
subl %edx, “eax # get offset from start of block 
shrl $2, %eax # divide by 4, to convert from byte offset to index 
ret 
notthere: 


movl $-1, “eax 
ret 








平台 ， 因 此 程序 在 Intel CPU 的 32 位 平面 模式 下 运行 。) 


正如 注释 捷 指 示 的 ， 子 例 程 findfirst 从 内 存 中 一 个 指定 的 连续 单词 块 中 发 现 指 定 值 第 一 次 
出 现 处 。 该 子 例 程 的 返回 值 是 找到 该 值 的 单词 索引 (8,1,2,…)， 如 末 没 有 找到 ， 则 返回 -1。 








该 子 例 程 预期 参数 被 放 在 栈 上 ， 因 此 栈 在 输入 时 类 似 如 下 形式 : 
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address of the start of the block to be searched 要 搜索 块 开 始 处 的 地 址 
number of words in the block 块 中 的 单词 数量 
value to be searched 要 找 的 值 

return address 返回 地 址 


说 明 Intel 栈 向 下 延伸 ， 即 向 内 存 中 的 地 址 0 增长 。 地 址 较 小 的 单词 出 现在 图 中 较 下 方 。 








为 了 引入 可 以 使 用 GDB 会 找 的 一 个 程序 错误 , 我 们 故意 搅乱 “ 主 ” 程序 调用 序列 中 的 元 又 。 


push $x+4 # start search at the 5 
push $168 # search for 168 (deliberately out of order) 
push $4 # search 4 words 


调用 之 前 的 指令 则 应 当 是 : 


push $x+4 # start search at the 5 
push $4 # search 4 words 
push $168 # search for 168 


正如 在 编译 C/C++ 代码 时 将 -g 选 项 用 于 GDB/DDD 一 样 ， 这 里 在 汇编 层 上 使 用 -gstabs。 


$ as -a --gstabs -o testff.o testff.s 


eI AE Y —^ Hbi x frtestfo. FF BEES E T LA DR VI EA RO VALS BAN T 
BG T0 EA fs E te IOS ET i ORE n] BEA HS C f e 
然后 我 们 链接 : 


$ ld testff.o 


这 时 产生 了 一 个 可 执行 文件 ， 默 认 名 为 q.out。 
让 我 们 在 GDB 下 运行 该 代位 。 


(gdb) b done 

Breakpoint 1 at 0x8048085: file testff.s, line 18. 
(gdb) r 

Starting program: /debug/a.out 

Breakpoint 1, done () at testff.s:18 

18 movl %edi, “edi # dummy for breakpoint 
Current language: auto; currently asm 

(gdb) p $eax 

$1 = -1 


























RAB, n ERR eos S HAR SLE SES. EAH] P $eaxXEZREAXTEPIESS. (AXE, VATE 
TE SETTE -1, AeA TESS ER ACH TIE PKI [8.168 - 
aL Si e PEPPY, MEUM TS Sees ae tor SN te Eo AC, LEE T WE E. 
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Bo NTA PAS BUI AB BEY Air Et BR o 


(gdb) b findfirst 
Breakpoint 2 at 0x8048087: file testff.s, line 25. 


(gdb) r 

The program being debugged has been started already. 

Start it from the beginning? (y or n) y 

Starting program: /debug/a.out 

Breakpoint 2, findfirst () at testff.s:25 

25 movl 4(Xesp), %ebx 

(gdb) x/4w $esp 

oxbtffd9a0: 0x08048085 Ox00000004  0x000000a8  0x080490b4 


这 个 栈 当 然 是 内 存 的 一 部 分 。 因 此 要 检查 它 ， 必 须 使 用 GDB 中 检查 内 存 的 x 命令 。 这 里 ， 我 
们 要 求 GDB 显 示 从 栈 指 针 ESP 指 示 的 位 置 开始 的 4 个 里 词 ( 注 章 上 和 面 的 栈 图 显示 了 4 个 单词 )。x 命 
令 会 显 丰 内存， 以 便 增加 地 址 。 这 正 是 所 需要 的 ， 因 为 在 Intel 染 构 上 和 在 很 多 其 他 染 构 上 一 样 ， 
FRE ONK HI. 

从 上 和 面 显示 的 栈 图 中 可 以 看 到 第 一 个 单词 应 为 返回 地 址 。 有 多 种 方式 可 以 检查 这 一 预期 。 一 
种 方法 是 使 用 GDB 的 disassemble 命 令 ， 该 命令 列 出 了 汇编 语言 指令 〈 机 需 码 的 反问 翻译 ) 及 其 
地 址 。 单 步 进入 子 例 程 ， 然 后 可 以 检查 栈 上 第 一 个 单词 的 内 容 是 否 与 调用 后 函数 的 地 址 相 匹 配 。 

检 得 后 将 发 现 是 匹配 的 。 然 而 ， 第 二 个 数学 4 本 应 为 被 搜索 的 值 (168)， 而 实际 上 是 搜索 块 
的 大 小 〈4)。 从 这 一 信息 可 以 很 快意 识 到 我 们 不 小 心 在 调用 前 交换 了 这 两 个 push 指 令 。 




















最 前 冶 的 [T 类 电子 书 发 售 平 全 


电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同 行 还 在 狂 
驳 仿 得 的 时 候 ， 图 灵 社 区 已 经 采取 实际 行动 拥抱 这 个 
出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 全 类 出 
版 商 ， 图 灵 社 区 目前 为 读者 提供 两 种 DRM -free 的 阅读 
体验 : 在 线 阅读 和 PDF。 



































相 比 纸 质 书 ， 电 子 书 具 有 许多 明显 的 优势 。 它 不 仅 发 
布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 片 ( 即 使 
有 的 书 纸 质 版 是 黑白 印刷 的 ) 。 读 着 还 可 以 万 便 地 进 
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最 方便 的 开放 出 版 平 合 


图 灵 社 区 同 读 着 开放 在 线 写 作 功 能 ， 协 助 你 实现 目 出 
版 和 开源 出 版 的 梦想 。 利 用 “合集 功能 ， 你 就 能 联 
合 二 三 好 友 共 同 创 作 一 部 技术 参考 书 ， 以 免费 或 收费 
的 形式 提供 给 读 着 。 (收费 形式 须 经 过 图 灵 社 区 立项 
评审 。) 这 极 大 地 降低 了 出 版 的 门 柳 。 只 要 你 有 写作 
的 意愿 ， 图 灵 社 区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 
书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 























图 灵 社 区 引进 出 厂 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 
社区 公布 。 如 末 你 有 意 翻 译 哪 本 图 书 ， 欢 迎 你 来 社区 
申请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 
FA. IMMER, 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 效力 的 。 


欢迎 加 入 


各 灵 储 区 


图 灵 社 区 进一步 把 传统 出 版 流程 导电 子 书 出 版 业务 
紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 稿 、 编 辑 网 上 
审 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
式 ， 我 们 称 之 为 “敏捷 出 版 ”， 筷 可 以 让 谈 着 以 较 
快 的 速度 了 解 到 国外 最 新 扩 术 图 书 的 内 容 ， 弥 补 以 
往 翻 译 版 技术 书 “ 出 版 妈 过 时 ”的 缺憾 。 同 时 ， 敏 
捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 万 便 ， 可 以 
提前 销 灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 


的 质量 。 









































最 直接 的 读者 交流 平台 


在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文章 、 提 区 勘 
误 、 发 表 评论 ， 以 各 种 方式 与 作 译 背 、 纲 辑 人 员 和 
其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 
银子 o 

















fn] APES AST ERUIT. WOES PEXE 
等 多 种 活动 ， 顾 取 积 分 和 银子 ， 积 累 个 人 声望 。 








